Appearance
Nous Research
Nous Research 是一个去中心化的 AI 研究组织,以高性能的开源模型微调和注重 Agent 能力的模型训练而闻名。其 Hermes 系列模型 是开源社区中最具代表性的指令微调模型家族之一,率先在开源模型中实现了匹敌闭源模型的函数调用(Function Calling)能力。
Overview
Nous Research 并非传统公司或实验室——它是一个由社区驱动的分布式 AI 研究组织,专注于高性能开源模型的微调和对齐。Nous 的核心理念是通过高质量的数据工程和精细化的训练方法,将基座模型(如 Llama、Mistral)转化为在指令遵循、工具调用和 Agent 场景中表现优异的生产级模型。其旗舰系列 Hermes 已成为开源 Agent 能力的事实标准之一。
Model Timeline: Hermes 家族
| 模型 | 发布时间 | 基座模型 | 参数规模 | 关键特征 |
|---|---|---|---|---|
| Hermes 1 | 2023 年中 | LLaMA / Llama 2 | 7B, 13B | 早期指令微调探索 |
| Hermes 2 Pro Mistral | 2024-01 | Mistral 7B | 7B | 首个原生函数调用开源模型 |
| Hermes 2 Pro Mixtral | 2024-03 | Mixtral 8x7B | 8x7B MoE | 函数调用 + 强推理能力 |
| Hermes 3 Llama 3.1 8B | 2024-10 | Llama 3.1 8B | 8B | 改进的角色扮演、多轮对话一致性 |
| Hermes 3 Llama 3.1 70B | 2024-10 | Llama 3.1 70B | 70B | 旗舰级 Agent 能力,128K 上下文 |
| Hermes 3 Llama 3.1 405B | 计划中 | Llama 3.1 405B | 405B | (待发布) |
Key Capabilities
Function Calling(函数调用)
Hermes 在开源社区中率先实现了结构化的函数调用能力,这是其最重要的技术创新:
- Hermes 2 Pro 是首批在开源模型中匹配 GPT-4 级函数调用性能的模型
- 支持定义多个工具、传递 JSON 参数、解释工具返回结果
- 在 Berkeley Function Calling Leaderboard 和 NexusRaven 等评测中表现优异
- Nous 公开了完整的训练数据集和训练脚本(GitHub:
NousResearch/Hermes-Function-Calling)
Agent 能力
- 经过微调使其能作为自主 Agent 运行——推理→工具调用→结果分析→再决策
- 支持多步任务,维护对话状态
- 在系统提示遵循(System Prompt Following)方面表现突出——开发者可定义角色、约束和工具
- 角色扮演(Role-playing)和多轮对话一致性优于大多数开源模型
训练方法
- SFT(监督微调):全部 Hermes 模型使用 SFT,未使用 RLHF
- 数据配方:混合合成数据(来自 GPT-4/Claude 生成)+ 人工精选数据
- 函数调用数据(工具定义 + 多轮函数执行轨迹)
- 通用指令数据(No Robots、Code Alpaca 等)
- 安全和对齐数据(拒绝回答、偏见减少)
- 训练框架:Axolotl(开源),全参数微调(非 LoRA)
- 核心理念:数据质量优于数量
Why It Matters
- Hermes 率先在开源模型中实现匹敌闭源模型的函数调用能力——这一突破直接推动了下游 Agent 框架(AutoGen、CrewAI 等)对开源模型的支持
- Hermes 的训练配方和数据被大量下游模型采用(Dolphin、Tulu 等),影响力远超模型本身
- Nous Research 证明了:无需 RLHF、无需巨额预算,通过精心设计的数据配方,开源微调可以达到接近闭源前沿的 Agent 能力
- Hermes 模型因其系统提示遵循性好、Agent 能力强,被广泛用于角色扮演、编程助手、交互式 Agent 等场景
- 与 Mixture of Experts、AI Agents、Fine-tuning 等概念高度相关
- 与 Llama(基座)、Mistral AI(基座)、Qwen、DeepSeek 共同构成了开源模型的完整生态
Relationships
- 相关基座模型:Llama、Mistral AI
- 相关概念:AI Agents、Fine-tuning、Mixture of Experts、Model Inference & Deployment
- 相关公司:OpenAI、Anthropic、DeepSeek
Open Questions
- Hermes 3 405B 的发布时间和性能表现如何?
- 在 DeepSeek、Qwen 等原生高性能模型崛起后,基于 Llama/Mistral 的微调路线能否保持差异化?
- Nous Research 的去中心化模式在长期中如何持续——资金、算力、社区贡献的可持续性?
Sources
- Nous Research Official (nousresearch.com)
- Hugging Face: NousResearch Organization (huggingface.co/NousResearch)
- GitHub: NousResearch/Hermes-Function-Calling
- Hermes 3 Llama 3.1 70B Model Card
- Berkeley Function Calling Leaderboard