Nous Research

Nous Research 是一个去中心化的 AI 研究组织，以高性能的开源模型微调和注重 Agent 能力的模型训练而闻名。其 Hermes 系列模型 是开源社区中最具代表性的指令微调模型家族之一，率先在开源模型中实现了匹敌闭源模型的函数调用（Function Calling）能力。

Overview

Nous Research 并非传统公司或实验室——它是一个由社区驱动的分布式 AI 研究组织，专注于高性能开源模型的微调和对齐。Nous 的核心理念是通过高质量的数据工程和精细化的训练方法，将基座模型（如 Llama、Mistral）转化为在指令遵循、工具调用和 Agent 场景中表现优异的生产级模型。其旗舰系列 Hermes 已成为开源 Agent 能力的事实标准之一。

Model Timeline: Hermes 家族

模型	发布时间	基座模型	参数规模	关键特征
Hermes 1	2023 年中	LLaMA / Llama 2	7B, 13B	早期指令微调探索
Hermes 2 Pro Mistral	2024-01	Mistral 7B	7B	首个原生函数调用开源模型
Hermes 2 Pro Mixtral	2024-03	Mixtral 8x7B	8x7B MoE	函数调用 + 强推理能力
Hermes 3 Llama 3.1 8B	2024-10	Llama 3.1 8B	8B	改进的角色扮演、多轮对话一致性
Hermes 3 Llama 3.1 70B	2024-10	Llama 3.1 70B	70B	旗舰级 Agent 能力，128K 上下文
Hermes 3 Llama 3.1 405B	计划中	Llama 3.1 405B	405B	(待发布)

Key Capabilities

Function Calling（函数调用）

Hermes 在开源社区中率先实现了结构化的函数调用能力，这是其最重要的技术创新：

Hermes 2 Pro 是首批在开源模型中匹配 GPT-4 级函数调用性能的模型
支持定义多个工具、传递 JSON 参数、解释工具返回结果
在 Berkeley Function Calling Leaderboard 和 NexusRaven 等评测中表现优异
Nous 公开了完整的训练数据集和训练脚本（GitHub: NousResearch/Hermes-Function-Calling）

Agent 能力

经过微调使其能作为自主 Agent 运行——推理→工具调用→结果分析→再决策
支持多步任务，维护对话状态
在系统提示遵循（System Prompt Following）方面表现突出——开发者可定义角色、约束和工具
角色扮演（Role-playing）和多轮对话一致性优于大多数开源模型

训练方法

SFT（监督微调）：全部 Hermes 模型使用 SFT，未使用 RLHF
数据配方：混合合成数据（来自 GPT-4/Claude 生成）+ 人工精选数据
- 函数调用数据（工具定义 + 多轮函数执行轨迹）
- 通用指令数据（No Robots、Code Alpaca 等）
- 安全和对齐数据（拒绝回答、偏见减少）
训练框架：Axolotl（开源），全参数微调（非 LoRA）
核心理念：数据质量优于数量

Why It Matters

Hermes 率先在开源模型中实现匹敌闭源模型的函数调用能力——这一突破直接推动了下游 Agent 框架（AutoGen、CrewAI 等）对开源模型的支持
Hermes 的训练配方和数据被大量下游模型采用（Dolphin、Tulu 等），影响力远超模型本身
Nous Research 证明了：无需 RLHF、无需巨额预算，通过精心设计的数据配方，开源微调可以达到接近闭源前沿的 Agent 能力
Hermes 模型因其系统提示遵循性好、Agent 能力强，被广泛用于角色扮演、编程助手、交互式 Agent 等场景
与 Mixture of Experts、AI Agents、Fine-tuning 等概念高度相关
与 Llama（基座）、Mistral AI（基座）、Qwen、DeepSeek 共同构成了开源模型的完整生态

Relationships

相关基座模型：Llama、Mistral AI
相关概念：AI Agents、Fine-tuning、Mixture of Experts、Model Inference & Deployment
相关公司：OpenAI、Anthropic、DeepSeek

Open Questions

Hermes 3 405B 的发布时间和性能表现如何？
在 DeepSeek、Qwen 等原生高性能模型崛起后，基于 Llama/Mistral 的微调路线能否保持差异化？
Nous Research 的去中心化模式在长期中如何持续——资金、算力、社区贡献的可持续性？

Sources

Nous Research Official (nousresearch.com)
Hugging Face: NousResearch Organization (huggingface.co/NousResearch)
GitHub: NousResearch/Hermes-Function-Calling
Hermes 3 Llama 3.1 70B Model Card
Berkeley Function Calling Leaderboard
Large Language Model (LLM) — 大语言模型的核心定义、技术原理与发展历程

Nous Research ​

Overview ​

Model Timeline: Hermes 家族 ​

Key Capabilities ​

Function Calling（函数调用） ​

Agent 能力 ​

训练方法 ​

Why It Matters ​

Relationships ​

Open Questions ​

Sources ​