Appearance
Anthropic
Overview
Anthropic 是闭源大模型生态中的关键公司,定位为一家强调 AI safety、可靠性、可解释性与可控性的研究公司。2021 年由前 OpenAI 员工(Dario Amodei、Daniela Amodei 等)创立。不仅是模型提供方,也在持续输出关于 Agent、系统设计和模型使用方法的工程观点。截至 2026 年估值约 $600 亿。
Model Timeline
| 模型 | 发布时间 | 参数规模 | 上下文窗口 | 架构特点 |
|---|---|---|---|---|
| Claude 1 | 2023-03 | 未公开 | 8K | 基于 Constitutional AI 训练 |
| Claude 2 | 2023-07 | 未公开 | 100K | 长上下文突破 |
| Claude 2.1 | 2023-11 | 未公开 | 200K | 更长上下文,降低幻觉 |
| Claude 3 Haiku | 2024-03 | 未公开 | 200K | 轻量高性价比 |
| Claude 3 Sonnet | 2024-03 | 未公开 | 200K | 中端主力 |
| Claude 3 Opus | 2024-03 | 未公开(约 2T MoE) | 200K | 顶级旗舰,超越 GPT-4 |
| Claude 3.5 Sonnet | 2024-06 | 未公开 | 200K | 最佳性价比/性能平衡 |
| Claude 3.5 Haiku | 2024-10 | 未公开 | 200K | 最快响应速度 |
| Claude 4 (Sonnet/Opus) | 2025 | 未公开 | 200K+ | 下一代架构,Agent 能力提升 |
Benchmark Scores
| 基准 | Claude 3.5 Sonnet | Claude 3 Opus | Claude 4 (Opus 估计) |
|---|---|---|---|
| MMLU | 88.7% | 86.8% | 90.8% |
| HumanEval | 92.0% | 84.1% | 94.1% |
| MATH | 71.5% | 60.1% | 84.6% |
| GPQA Diamond | 60.1% | 59.8% | 70.2% |
| HellaSwag | 95.0% | 93.4% | 96.8% |
| TruthfulQA | 76.5% | 72.2% | 80.1% |
API Pricing(截至 2026 年 4 月)
| 模型 | 输入 ($/1M tokens) | 输出 ($/1M tokens) | 缓存输入 |
|---|---|---|---|
| Claude 4 Opus | $15.00 | $75.00 | $7.50 |
| Claude 4 Sonnet | $3.00 | $15.00 | $1.50 |
| Claude 3.5 Sonnet | $3.00 | $15.00 | $1.50 |
| Claude 3.5 Haiku | $0.80 | $4.00 | $0.40 |
| Claude 3 Haiku | $0.25 | $1.25 | $0.125 |
Architecture Notes
- Anthropic 从未官方披露模型参数规模或架构细节(比 OpenAI 更保密)
- 行业普遍推测 Claude 3 Opus 为 MoE 架构,总参数约 2T,激活参数约 200-300B
- Claude 系列的核心差异化是 Constitutional AI:在训练过程中将行为准则内化到模型权重中,而非依赖于 RLHF 后处理
- 200K 上下文窗口是 Claude 系列的标志性能力——支持长文档、代码库分析
- Claude 4 系列在 Agent 工具使用和多步推理上有重大提升(据 Anthropic 博客)
Why It Matters
- Anthropic 是理解"安全导向的大模型公司"这一路线的关键入口
- 它与 OpenAI、DeepSeek、Qwen 的对比,有助于理解不同公司在开放程度、产品化策略和安全叙事上的差异
- Anthropic 的工程方法论输出(workflow vs agent 框架、Prompt Engineering 指南)正在塑造行业实践
- 它也与 AI Agents、Transformer Architecture、Mixture of Experts、RLHF 等主题密切相关
Relationships
- 相关公司:OpenAI、DeepSeek、Qwen、Google Gemini & DeepMind
- 相关概念:AI Agents、Model Context Protocol (MCP)、Transformer Architecture、Mixture of Experts、RLHF、Model Inference & Deployment
Open Questions
- Anthropic 的"安全导向"会如何具体影响其产品与 API 策略?
- Claude 4 的 Agent 能力能否在 Operator/Claude Code 等场景中建立真实差异化?
- Anthropic 在保持闭源的同时如何应对开源模型的追赶?
Sources
- raw/articles/anthropic-company-2026-04-26.md
- raw/articles/anthropic-building-effective-agents-2026-04-26.md
- Anthropic Documentation (docs.anthropic.com)
- Claude 3 Model Card, Claude 3.5 System Card