Skip to content

Nous Research

Nous Research 是一个去中心化的 AI 研究组织,以高性能的开源模型微调和注重 Agent 能力的模型训练而闻名。其 Hermes 系列模型 是开源社区中最具代表性的指令微调模型家族之一,率先在开源模型中实现了匹敌闭源模型的函数调用(Function Calling)能力。

Overview

Nous Research 并非传统公司或实验室——它是一个由社区驱动的分布式 AI 研究组织,专注于高性能开源模型的微调和对齐。Nous 的核心理念是通过高质量的数据工程和精细化的训练方法,将基座模型(如 Llama、Mistral)转化为在指令遵循、工具调用和 Agent 场景中表现优异的生产级模型。其旗舰系列 Hermes 已成为开源 Agent 能力的事实标准之一。

Model Timeline: Hermes 家族

模型发布时间基座模型参数规模关键特征
Hermes 12023 年中LLaMA / Llama 27B, 13B早期指令微调探索
Hermes 2 Pro Mistral2024-01Mistral 7B7B首个原生函数调用开源模型
Hermes 2 Pro Mixtral2024-03Mixtral 8x7B8x7B MoE函数调用 + 强推理能力
Hermes 3 Llama 3.1 8B2024-10Llama 3.1 8B8B改进的角色扮演、多轮对话一致性
Hermes 3 Llama 3.1 70B2024-10Llama 3.1 70B70B旗舰级 Agent 能力,128K 上下文
Hermes 3 Llama 3.1 405B计划中Llama 3.1 405B405B(待发布)

Key Capabilities

Function Calling(函数调用)

Hermes 在开源社区中率先实现了结构化的函数调用能力,这是其最重要的技术创新:

  • Hermes 2 Pro 是首批在开源模型中匹配 GPT-4 级函数调用性能的模型
  • 支持定义多个工具、传递 JSON 参数、解释工具返回结果
  • 在 Berkeley Function Calling Leaderboard 和 NexusRaven 等评测中表现优异
  • Nous 公开了完整的训练数据集和训练脚本(GitHub: NousResearch/Hermes-Function-Calling

Agent 能力

  • 经过微调使其能作为自主 Agent 运行——推理→工具调用→结果分析→再决策
  • 支持多步任务,维护对话状态
  • 在系统提示遵循(System Prompt Following)方面表现突出——开发者可定义角色、约束和工具
  • 角色扮演(Role-playing)和多轮对话一致性优于大多数开源模型

训练方法

  • SFT(监督微调):全部 Hermes 模型使用 SFT,未使用 RLHF
  • 数据配方:混合合成数据(来自 GPT-4/Claude 生成)+ 人工精选数据
    • 函数调用数据(工具定义 + 多轮函数执行轨迹)
    • 通用指令数据(No Robots、Code Alpaca 等)
    • 安全和对齐数据(拒绝回答、偏见减少)
  • 训练框架:Axolotl(开源),全参数微调(非 LoRA)
  • 核心理念:数据质量优于数量

Why It Matters

  • Hermes 率先在开源模型中实现匹敌闭源模型的函数调用能力——这一突破直接推动了下游 Agent 框架(AutoGen、CrewAI 等)对开源模型的支持
  • Hermes 的训练配方和数据被大量下游模型采用(Dolphin、Tulu 等),影响力远超模型本身
  • Nous Research 证明了:无需 RLHF、无需巨额预算,通过精心设计的数据配方,开源微调可以达到接近闭源前沿的 Agent 能力
  • Hermes 模型因其系统提示遵循性好、Agent 能力强,被广泛用于角色扮演、编程助手、交互式 Agent 等场景
  • Mixture of ExpertsAI AgentsFine-tuning 等概念高度相关
  • Llama(基座)、Mistral AI(基座)、QwenDeepSeek 共同构成了开源模型的完整生态

Relationships

Open Questions

  • Hermes 3 405B 的发布时间和性能表现如何?
  • 在 DeepSeek、Qwen 等原生高性能模型崛起后,基于 Llama/Mistral 的微调路线能否保持差异化?
  • Nous Research 的去中心化模式在长期中如何持续——资金、算力、社区贡献的可持续性?

Sources

  • Nous Research Official (nousresearch.com)
  • Hugging Face: NousResearch Organization (huggingface.co/NousResearch)
  • GitHub: NousResearch/Hermes-Function-Calling
  • Hermes 3 Llama 3.1 70B Model Card
  • Berkeley Function Calling Leaderboard

AI Knowledge Base — 持续积累