Appearance
xAI (Grok)
Elon Musk 于 2023 年创立的 AI 公司,目标是"理解宇宙的真实本质"。以 Grok 系列大语言模型闻名,深度整合 X/Twitter 平台获取实时数据。
公司概况
| 属性 | 信息 |
|---|---|
| 成立时间 | 2023 年 3 月 |
| 总部 | 美国加州旧金山湾区 |
| 创始人 | Elon Musk |
| 核心团队 | Igor Babuschkin(工程 lead)、来自 DeepMind/OpenAI/Google 的多位研究员 |
| 核心产品 | Grok 系列模型、X/Twitter 集成 AI 助手 |
| 开源贡献 | Grok-1 权重(Apache 2.0 许可) |
| 投资 | 2024 年 5 月完成 60 亿美元 B 轮融资(估值约 240 亿美元) |
| 基础设施 | 10 万张+ GPU 集群(Memphis 数据中心) |
模型矩阵
| 模型 | 发布时间 | 架构 | 参数 | 上下文 | 开源 |
|---|---|---|---|---|---|
| Grok-1 | 2023-11 | MoE 8×专家 | 314B (86B 激活) | 8K | 是 (Apache 2.0, 2024-03) |
| Grok-1.5 | 2024-03 | MoE (改进) | 未公开 | 128K | 否 |
| Grok-2 | 2024-08 (beta) | MoE | 未公开 | 256K | 否 |
| Grok-2 Mini | 2024-08 | MoE | 未公开 | 256K | 否 |
| Grok-3 | 2025-02 | MoE (增强) | 未公开 | 1M | 否 |
| Grok-3 Mini | 2025-02 | MoE | 未公开 | 1M | 否 |
基准表现
| 评测 | Grok-1 | Grok-2 | Grok-3 | 对比(同等规模) |
|---|---|---|---|---|
| MMLU | 73% | 87.5% | ~90%+ | GPT-4: 86.4% |
| HumanEval | 63.2% | 88.4% | ~92% | Claude 3: 92% |
| MATH | — | 76.1% | ~85% | GPT-4: 92% |
| GSM8K | 62.9% | — | — | — |
| Chatbot Arena ELO | — | ~1250 | >1400 (Rank #1) | GPT-4o: ~1360 |
注:基准数据来自官方公告和第三方评测。Grok-3 部分数据基于官方声称。
API 定价
| 模型 | 输入(每 M tokens) | 输出(每 M tokens) |
|---|---|---|
| Grok-2 | $2.00 | $10.00 |
| Grok-2 Mini | $0.15 | $0.60 |
| Grok-3 | $5.00 | $15.00 |
| Grok-3 Mini | $0.50 | $3.00 |
技术特色
实时知识
通过 X/Twitter 平台获取实时数据流,使 Grok 具备其他模型不具备的实时信息能力。这是其与竞争对手最大的差异化优势。
低审查设计
xAI 宣称 Grok 的审查限制比主要竞争对手大幅降低,定位为"追求极致真相"的 AI 助手。
架构演进
- Grok-1: 经典 MoE,8 个专家,可选 top-2 路由
- Grok-2/3: 使用更先进的 MoE 架构,引入 GQA 和更大上下文窗口
- 训练规模: Grok-3 使用 2x Grok-2 的计算量
平台接入
- X Premium+ 用户: 内置 Grok 助手
- 独立 API: 开发者可通过 xAI API 接入
- X 平台集成: 能阅读和回复 X 帖子
相关实体
- OpenAI — 核心竞品,目标一致但路线不同
- DeepSeek — 开源 MoE 路线竞争对手
- Google Gemini & DeepMind — 多模态通用模型竞品
相关概念
- Mixture of Experts — Grok 基础架构
- Model Inference & Deployment — Grok 推理部署
- Chain-of-Thought & Reasoning — Grok 推理能力
参考来源
- xAI 官方博客 (x.ai/blog)
- xAI API 文档 (docs.x.ai)
- Grok-1 开源仓库 (github.com/xai-org/grok-1)
- xAI B 轮融资公告 (2024-05)
- 第三方评测 (Chatbot Arena, The Verge, TechCrunch)