Anthropic

Overview

Anthropic 是闭源大模型生态中的关键公司，定位为一家强调 AI safety、可靠性、可解释性与可控性的研究公司。2021 年由前 OpenAI 员工（Dario Amodei、Daniela Amodei 等）创立。不仅是模型提供方，也在持续输出关于 Agent、系统设计和模型使用方法的工程观点。截至 2026 年估值约 $600 亿。

Model Timeline

模型	发布时间	参数规模	上下文窗口	架构特点
Claude 1	2023-03	未公开	8K	基于 Constitutional AI 训练
Claude 2	2023-07	未公开	100K	长上下文突破
Claude 2.1	2023-11	未公开	200K	更长上下文，降低幻觉
Claude 3 Haiku	2024-03	未公开	200K	轻量高性价比
Claude 3 Sonnet	2024-03	未公开	200K	中端主力
Claude 3 Opus	2024-03	未公开(约 2T MoE)	200K	顶级旗舰，超越 GPT-4
Claude 3.5 Sonnet	2024-06	未公开	200K	最佳性价比/性能平衡
Claude 3.5 Haiku	2024-10	未公开	200K	最快响应速度
Claude 4 (Sonnet/Opus)	2025	未公开	200K+	下一代架构，Agent 能力提升

Benchmark Scores

基准	Claude 3.5 Sonnet	Claude 3 Opus	Claude 4 (Opus 估计)
MMLU	88.7%	86.8%	90.8%
HumanEval	92.0%	84.1%	94.1%
MATH	71.5%	60.1%	84.6%
GPQA Diamond	60.1%	59.8%	70.2%
HellaSwag	95.0%	93.4%	96.8%
TruthfulQA	76.5%	72.2%	80.1%

API Pricing（截至 2026 年 4 月）

模型	输入 ($/1M tokens)	输出 ($/1M tokens)	缓存输入
Claude 4 Opus	$15.00	$75.00	$7.50
Claude 4 Sonnet	$3.00	$15.00	$1.50
Claude 3.5 Sonnet	$3.00	$15.00	$1.50
Claude 3.5 Haiku	$0.80	$4.00	$0.40
Claude 3 Haiku	$0.25	$1.25	$0.125

Architecture Notes

Anthropic 从未官方披露模型参数规模或架构细节（比 OpenAI 更保密）
行业普遍推测 Claude 3 Opus 为 MoE 架构，总参数约 2T，激活参数约 200-300B
Claude 系列的核心差异化是 Constitutional AI：在训练过程中将行为准则内化到模型权重中，而非依赖于 RLHF 后处理
200K 上下文窗口是 Claude 系列的标志性能力——支持长文档、代码库分析
Claude 4 系列在 Agent 工具使用和多步推理上有重大提升（据 Anthropic 博客）

Why It Matters

Anthropic 是理解"安全导向的大模型公司"这一路线的关键入口
它与 OpenAI、DeepSeek、Qwen 的对比，有助于理解不同公司在开放程度、产品化策略和安全叙事上的差异
Anthropic 的工程方法论输出（workflow vs agent 框架、Prompt Engineering 指南）正在塑造行业实践
它也与 AI Agents、Transformer Architecture、Mixture of Experts、RLHF 等主题密切相关

Relationships

相关公司：OpenAI、DeepSeek、Qwen、Google DeepMind
相关概念：AI Agents、Model Context Protocol (MCP)、Transformer Architecture、Mixture of Experts、RLHF、Model Inference & Deployment

Open Questions

Anthropic 的"安全导向"会如何具体影响其产品与 API 策略？
Claude 4 的 Agent 能力能否在 Operator/Claude Code 等场景中建立真实差异化？
Anthropic 在保持闭源的同时如何应对开源模型的追赶？

Sources

raw/articles/anthropic-company-2026-04-26.md
raw/articles/anthropic-building-effective-agents-2026-04-26.md
Anthropic Documentation (docs.anthropic.com)
Claude 3 Model Card, Claude 3.5 System Card
Large Language Model (LLM) — 大语言模型的核心定义、技术原理与发展历程