Appearance
01.AI (零一万物)
由李开复于 2023 年创办的中国 AI 公司,以 Yi(一)系列开源模型闻名。01.AI 是中国大模型"六小龙"中起点最高的——创始人李开复是华人 AI 界最具全球影响力的布道者之一。公司战略经历了从"最强开源模型"到"AI 应用平台"的显著转向。
Overview
零一万物(01.AI)成立于 2023 年 7 月,由创新工场(Sinovation Ventures)董事长兼 CEO 李开复(Kai-Fu Lee)创办。李开复在创办 01.AI 之前曾任 Google 中国总裁、微软亚洲研究院(MSRA)创始院长、苹果高管,是全球 AI 领域最资深的华人技术领袖之一。
公司总部位于北京,成立之初便以高性能开源模型为核心路线,首批 Yi-6B 和 Yi-34B 在发布时(2023 年 11 月)分别在各自参数规模级别上的多项基准中名列全球第一。
截至 2026 年,01.AI 累计融资超过 3 亿美元,投资方包括阿里巴巴、创新工场等,估值约 10-15 亿美元。
Model Timeline
| 模型 | 发布时间 | 参数规模 | 上下文窗口 | 特点 |
|---|---|---|---|---|
| Yi-6B | 2023-11 | 6B | 4K | 同规模开源模型 MMLU 最高分(至发布时) |
| Yi-34B | 2023-11 | 34B | 4K | 同规模 MMLU/Eval 多项第一,3B 高质量训练数据 |
| Yi-34B-200K | 2023-11 | 34B | 200K | 长上下文扩展版,通过位置编码外推实现 |
| Yi-VL-6B / 34B | 2024-01 | 6B/34B | 4K | 多模态视觉语言模型,CLIP + LLM 架构 |
| Yi-1.5 (6B/9B/34B) | 2024-05 | 6B/9B/34B | 4K | 全面升级版,更强推理能力 |
| Yi-Lightning | 2024-09 | 未公开 | 未公开 | API 极速版,延迟优化,对标 GPT-4o 速度 |
| Yi-Coder | 2024-09 | 1.5B/9B | 128K | 代码专用模型,128K 长上下文 |
| Yi-Large | 2024-06 | 未公开 (估计 100B+) | 32K | API 旗舰模型,闭源 |
Training Philosophy
零一万物的模型训练有鲜明的李开复风格——强调数据质量和工程精度:
- 3B Token 高质量数据集:Yi 的预训练数据总量虽大,但核心优势在于 3B tokens 的超高质量精选数据——"少量极高质量数据 > 海量低质量数据"
- 中英双语均衡:不偏向单一语言,让模型在中英文任务上都表现自然
- 长上下文外推:Yi-34B-200K 通过位置编码插值(PI)等技术实现 4K → 200K 扩展,是早期长上下文开源模型的标杆
- 效率优先:Yi-Lightning 代表了 01.AI 的推理优化方向——即使模型质量与竞品持平,也要在延迟和成本上胜出
API Pricing(截至 2026 年 4 月)
| 模型 | 输入 (元/1M tokens) | 输出 (元/1M tokens) | 备注 |
|---|---|---|---|
| Yi-Large | 20 | 20 | 旗舰模型 |
| Yi-Medium | 2.5 | 2.5 | 中档 |
| Yi-Lightning | 1 | 1 | 极速经济版 |
| Yi-Vision | 20 | 20 | 视觉理解 |
| Yi-Spark | 1 | 1 | 超轻量快速对话 |
注:01.AI 的输入和输出价格相同(不分 input/output 定价),以人民币计价。Yi-Lightning/Yi-Spark 的 1 元定价使其跻身国内最有竞争力的 API 价格梯队。
Benchmark 表现
| 基准 | Yi-34B | Yi-1.5-34B | Yi-Large | DeepSeek-V3(参考) |
|---|---|---|---|---|
| MMLU | 76.3% | 80.7% | ~85% | 88.5% |
| HumanEval | 67.7% | 75.0% | ~82% | 82.6% |
| CMMLU (中文) | 81.5% | 84.0% | ~88% | — |
| MATH | 49.2% | 58.0% | ~70% | 79.2% |
关键洞察:Yi 系列在 34B 参数级别有很强竞争力(Yi-34B 首发时多项第一),但在超大规模(如 DeepSeek-V3 的 671B MoE)面前,纯稠密架构的性价比天花板显而易见。
Strategic Pivot (传闻与观察)
2024 年下旬起,多路信息显示 01.AI 正在进行重大战略调整:
- 从"模型公司"到"应用公司":李开复在多个场合强调"AI-Native 应用"比"训练最好的模型"更值得投入
- 团队收缩与重组:部分大模型研发人员转岗至 AI 应用开发
- 聚焦"万知"等 AI 应用:公司资源向 C 端 AI 产品倾斜
- 背景:面对 DeepSeek 的极致性价比和 ByteDance 的流量碾压,中小型模型公司纯靠"开源模型更好一点"难以差异化
Why It Matters
- 李开复的 AI 哲学实践样本:01.AI 是"AI 超级对齐"(李开复《AI 2041》合著中讨论的概念)和"AI 应用优先"理念在真实商业环境中的实验
- 开源 LLM 质量军备竞赛的重要参与者:Yi-34B 首发时的多项第一向行业证明——小公司也可以在特定维度超越 OpenAI
- 极速推理的标杆:Yi-Lightning 的低延迟路线验证了"好够快 > 最好但慢"的工程哲学
- AI 行业转向的缩影:从"训练模型"到"做应用"的 pivot,反映了中国 AI 创业公司在 2024-2025 年的集体困境与转型
Relationships
- 中国"六小龙"同侪:Zhipu AI、Moonshot AI (月之暗面)、DeepSeek、MiniMax、百川、阶跃星辰
- 投资方关系:阿里巴巴(也是 Qwen 的母公司)
- 国际对标:Mistral AI(同为中小规模、偏重开源和效率的模型公司)
- 相关概念:Fine-tuning、Scaling Laws、Multimodal Models
- 对比:与 DeepSeek 同在追求效率,但 01.AI 偏向应用交付,而 DeepSeek 偏向极致技术
Open Questions
- 01.AI 是否会完全放弃开源模型路线,全面转向 AI 应用?如果是,Yi 系列的长期维护怎么办?
- 李开复的全球人脉能否为 01.AI 打开海外市场?还是公司会聚焦中国市场?
- 如果"万知"等应用无法获得 Kimi 或豆包级别的用户增长,01.AI 的下一条路是什么?
- 作为"六小龙"中 CEO 最不"年轻极客"的一家,李开复的资源和人脉优势能否转化为 AI 时代的产品创造力?
Sources
李开复公开演讲与媒体采访(LatePost、极客公园等)
Large Language Model (LLM) — 大语言模型的核心定义、技术原理与发展历程