Skip to content

Anthropic

Overview

Anthropic 是闭源大模型生态中的关键公司,定位为一家强调 AI safety、可靠性、可解释性与可控性的研究公司。2021 年由前 OpenAI 员工(Dario Amodei、Daniela Amodei 等)创立。不仅是模型提供方,也在持续输出关于 Agent、系统设计和模型使用方法的工程观点。截至 2026 年估值约 $600 亿。

Model Timeline

模型发布时间参数规模上下文窗口架构特点
Claude 12023-03未公开8K基于 Constitutional AI 训练
Claude 22023-07未公开100K长上下文突破
Claude 2.12023-11未公开200K更长上下文,降低幻觉
Claude 3 Haiku2024-03未公开200K轻量高性价比
Claude 3 Sonnet2024-03未公开200K中端主力
Claude 3 Opus2024-03未公开(约 2T MoE)200K顶级旗舰,超越 GPT-4
Claude 3.5 Sonnet2024-06未公开200K最佳性价比/性能平衡
Claude 3.5 Haiku2024-10未公开200K最快响应速度
Claude 4 (Sonnet/Opus)2025未公开200K+下一代架构,Agent 能力提升

Benchmark Scores

基准Claude 3.5 SonnetClaude 3 OpusClaude 4 (Opus 估计)
MMLU88.7%86.8%90.8%
HumanEval92.0%84.1%94.1%
MATH71.5%60.1%84.6%
GPQA Diamond60.1%59.8%70.2%
HellaSwag95.0%93.4%96.8%
TruthfulQA76.5%72.2%80.1%

API Pricing(截至 2026 年 4 月)

模型输入 ($/1M tokens)输出 ($/1M tokens)缓存输入
Claude 4 Opus$15.00$75.00$7.50
Claude 4 Sonnet$3.00$15.00$1.50
Claude 3.5 Sonnet$3.00$15.00$1.50
Claude 3.5 Haiku$0.80$4.00$0.40
Claude 3 Haiku$0.25$1.25$0.125

Architecture Notes

  • Anthropic 从未官方披露模型参数规模或架构细节(比 OpenAI 更保密)
  • 行业普遍推测 Claude 3 Opus 为 MoE 架构,总参数约 2T,激活参数约 200-300B
  • Claude 系列的核心差异化是 Constitutional AI:在训练过程中将行为准则内化到模型权重中,而非依赖于 RLHF 后处理
  • 200K 上下文窗口是 Claude 系列的标志性能力——支持长文档、代码库分析
  • Claude 4 系列在 Agent 工具使用和多步推理上有重大提升(据 Anthropic 博客)

Why It Matters

  • Anthropic 是理解"安全导向的大模型公司"这一路线的关键入口
  • 它与 OpenAIDeepSeekQwen 的对比,有助于理解不同公司在开放程度、产品化策略和安全叙事上的差异
  • Anthropic 的工程方法论输出(workflow vs agent 框架、Prompt Engineering 指南)正在塑造行业实践
  • 它也与 AI AgentsTransformer ArchitectureMixture of ExpertsRLHF 等主题密切相关

Relationships

Open Questions

  • Anthropic 的"安全导向"会如何具体影响其产品与 API 策略?
  • Claude 4 的 Agent 能力能否在 Operator/Claude Code 等场景中建立真实差异化?
  • Anthropic 在保持闭源的同时如何应对开源模型的追赶?

Sources

  • raw/articles/anthropic-company-2026-04-26.md
  • raw/articles/anthropic-building-effective-agents-2026-04-26.md
  • Anthropic Documentation (docs.anthropic.com)
  • Claude 3 Model Card, Claude 3.5 System Card

AI Knowledge Base — 持续积累