Appearance
Moonshot AI (月之暗面)
中国最受瞩目的 AI 创业公司之一,由清华叉院出身的杨植麟创办。Kimi 智能助手是国内用户增长最快的 AI 产品,以超长上下文(200K+ tokens)和深度推理能力著称。Moonshot AI 是中国大模型"六小龙"之一。
Overview
月之暗面(Moonshot AI)成立于 2023 年 3 月,由杨植麟(清华大学交叉信息研究院校友、CMU 博士、Transformer-XL / XLNet 合著者)创办。公司名称源于 Pink Floyd 专辑《The Dark Side of the Moon》,寓意探索未知。
截至 2026 年,Moonshot AI 累计融资超过 10 亿美元,投资方包括阿里巴巴、红杉中国、美团、小红书等,估值约 30-33 亿美元。旗下产品 Kimi 智能助手 自 2023 年 10 月上线以来,凭借长上下文能力和强大的推理性能,成为中国日活最高的 AI 对话产品之一。
公司的核心差异化在于:长上下文技术(从 20 万字到 200 万字,行业最早之一)、专注 C 端体验的用户产品思维、以及从基础研究到产品化的完整闭环。
Model Timeline
| 模型 | 发布时间 | 参数规模 | 上下文窗口 | 特点 |
|---|---|---|---|---|
| Moonshot-v1 | 2023-10 | 未公开 | 128K | 初代长上下文模型,支持 20 万字输入 |
| Moonshot-v1 (200K) | 2024-02 | 未公开 | 200K | 上下文扩展至 200K tokens,行业领先 |
| Kimi k1.5 | 2025-01 | 未公开(MoE 估计) | 128K | 推理增强版,基于 RL 训练,对标 o1/R1 |
| Kimi k2 | 2025-06 (估计) | 未公开 | 1M | 最新旗舰,1M 上下文 + 强推理能力 |
| Moonshot-v1-8k/32k | 2023/2024 | 未公开 | 8K/32K | API 快速版,降低成本 |
注:Moonshot AI 未公开绝大多数模型的技术参数,上述部分参数来自社区估计和分析报告。
Architecture Innovation
月之暗面在模型架构和长上下文技术上的核心贡献:
- Infini-attention / 无限注意力:杨植麟在 Google 期间参与的研究方向,实现 Transformer 在理论上无限长的上下文处理而不增加计算复杂度。Kimi 的超长上下文能力可能继承了这一研究方向
- 压缩式记忆机制:通过 Transformer-XL 式的段级循环(segment-level recurrence)和压缩记忆,使模型能低成本处理超长文本
- "注意力平权"理念:Kimi 团队提出的产品理念——让模型平等对待长文本中的每一部分,而非只关注开头和结尾
- RL inference scaling:k1.5 采用强化学习训练推理链,类似 o1/R1 的 test-time compute scaling
Benchmark 表现
注:Moonshot 不公开标准基准评测数据,以下为社区测评和公开报告的汇总估计:
| 基准 | Kimi k1.5 | Kimi k2 | GPT-4o(参考) |
|---|---|---|---|
| MMLU | ~86% | ~89% | 88.7% |
| HumanEval | ~82% | ~88% | 90.2% |
| MATH | ~92% | ~94% | 76.6% |
| CMMLU (中文) | ~90% | ~92% | 76.0% |
| 长上下文检索 (Needle-in-Haystack) | 99%+ | 99%+ | ~98% |
关键洞察:Kimi 系列在中文理解(CMMLU)和数学推理(MATH)上成绩突出,长上下文检索(Needle-in-Haystack)几近满分——这正是其产品核心优势所在。
API Pricing(截至 2026 年 4 月)
| 模型 | 输入 (元/1M tokens) | 输出 (元/1M tokens) | 备注 |
|---|---|---|---|
| Moonshot-v1-8k | 12 | 12 | 基础版,快速推理 |
| Moonshot-v1-32k | 24 | 24 | 中长上下文 |
| Moonshot-v1-128k | 60 | 60 | 长上下文标准版 |
| Kimi k2 | 待定 | 待定 | 最新旗舰,尚未全面开放 API |
注:Moonshot 的 API 输入和输出价格相同(不区分输入/输出),以人民币计价。长期有开发者免费额度。
Product Ecosystem
月之暗面以 C 端产品驱动增长:
| 产品 | 形态 | 定位 |
|---|---|---|
| Kimi 智能助手 | Web / App / 小程序 | 通用 AI 助手,长文档分析,联网搜索 |
| Kimi 浏览器插件 | Chrome / Edge 扩展 | 网页摘要、划词翻译、全文分析 |
| Kimi API | 开发者 API | 与 OpenAI 格式兼容,适合长文档处理场景 |
| Kimi+ | 内置应用商店 | Kimi 内的 Agent 生态(功能插件化) |
Moonshot vs Peer Comparison
月之暗面在中国大模型"六小龙"中的独特定位:
| 维度 | Moonshot (Kimi) | Zhipu AI | DeepSeek |
|---|---|---|---|
| 核心策略 | C 端爆款产品 | 开源 + B 端平台 | 极致技术效率 + 开源 |
| 技术差异化 | 长上下文 + 推理 | GLM 架构统一 | MoE + MLA |
| 开源态度 | 闭源 | 部分开源 (ChatGLM-6B) | 完全开源 (Apache 2.0) |
| 主要产品 | Kimi 助手 (日活千万级) | 智谱清言 + API | DeepSeek Chat + API |
| 估值 | ~$3B | ~$2.5B | 未融资(幻方孵化) |
Why It Matters
- 定义长上下文产品的范式:Kimi 是中国市场第一个让"传 200 万字文档"成为大众认知的 AI 产品,证明了长上下文是驱动用户增长的有效差异化
- C 端产品路线的标杆:与大多数中国 AI 公司走 B 端 API 路线不同,Moonshot 证明了 C 端 AI 助手可以通过产品体验获得海量用户
- 学术纯度到产品的完整闭环:杨植麟从 Transformer-XL、XLNet 的学术贡献者到创办产品公司,代表了 AI 学术与产业融合的最佳实践
- 推理模型的中国对标:k1.5/k2 是对 OpenAI o1/o3 和 DeepSeek-R1 的中国回应
Relationships
- 中国竞争对手:Zhipu AI、DeepSeek、Qwen、ByteDance
- 国际对标:OpenAI、Anthropic
- 相关概念:Chain-of-Thought & Reasoning、Transformer Architecture、Model Context Protocol (MCP)、Scaling Laws
- 投资方关系:阿里巴巴同时也是 Qwen 的母公司
Open Questions
- Kimi k2 的 1M 上下文在真实复杂任务(非 Needle-in-Haystack)中的可靠性如何?
- 月之暗面是否会走向开源?C 端产品路线的壁垒是否足以抵抗开源模型的冲击?
- 随着 DeepSeek 在推理模型上领先、ByteDance 在流量上碾压,Moonshot 的差异化能否持续?
- 杨植麟的学术背景如何持续转化为产品竞争力?后续技术路线是继续长上下文还是转向多模态/Agent?
Sources
杨植麟学术主页(Google Scholar)
媒体公开报道(36氪、LatePost、机器之心等)
Large Language Model (LLM) — 大语言模型的核心定义、技术原理与发展历程