Skip to content

Moonshot AI (月之暗面)

中国最受瞩目的 AI 创业公司之一,由清华叉院出身的杨植麟创办。Kimi 智能助手是国内用户增长最快的 AI 产品,以超长上下文(200K+ tokens)和深度推理能力著称。Moonshot AI 是中国大模型"六小龙"之一。

Overview

月之暗面(Moonshot AI)成立于 2023 年 3 月,由杨植麟(清华大学交叉信息研究院校友、CMU 博士、Transformer-XL / XLNet 合著者)创办。公司名称源于 Pink Floyd 专辑《The Dark Side of the Moon》,寓意探索未知。

截至 2026 年,Moonshot AI 累计融资超过 10 亿美元,投资方包括阿里巴巴、红杉中国、美团、小红书等,估值约 30-33 亿美元。旗下产品 Kimi 智能助手 自 2023 年 10 月上线以来,凭借长上下文能力和强大的推理性能,成为中国日活最高的 AI 对话产品之一。

公司的核心差异化在于:长上下文技术(从 20 万字到 200 万字,行业最早之一)、专注 C 端体验的用户产品思维、以及从基础研究到产品化的完整闭环。

Model Timeline

模型发布时间参数规模上下文窗口特点
Moonshot-v12023-10未公开128K初代长上下文模型,支持 20 万字输入
Moonshot-v1 (200K)2024-02未公开200K上下文扩展至 200K tokens,行业领先
Kimi k1.52025-01未公开(MoE 估计)128K推理增强版,基于 RL 训练,对标 o1/R1
Kimi k22025-06 (估计)未公开1M最新旗舰,1M 上下文 + 强推理能力
Moonshot-v1-8k/32k2023/2024未公开8K/32KAPI 快速版,降低成本

注:Moonshot AI 未公开绝大多数模型的技术参数,上述部分参数来自社区估计和分析报告。

Architecture Innovation

月之暗面在模型架构和长上下文技术上的核心贡献:

  • Infini-attention / 无限注意力:杨植麟在 Google 期间参与的研究方向,实现 Transformer 在理论上无限长的上下文处理而不增加计算复杂度。Kimi 的超长上下文能力可能继承了这一研究方向
  • 压缩式记忆机制:通过 Transformer-XL 式的段级循环(segment-level recurrence)和压缩记忆,使模型能低成本处理超长文本
  • "注意力平权"理念:Kimi 团队提出的产品理念——让模型平等对待长文本中的每一部分,而非只关注开头和结尾
  • RL inference scaling:k1.5 采用强化学习训练推理链,类似 o1/R1 的 test-time compute scaling

Benchmark 表现

注:Moonshot 不公开标准基准评测数据,以下为社区测评和公开报告的汇总估计:

基准Kimi k1.5Kimi k2GPT-4o(参考)
MMLU~86%~89%88.7%
HumanEval~82%~88%90.2%
MATH~92%~94%76.6%
CMMLU (中文)~90%~92%76.0%
长上下文检索 (Needle-in-Haystack)99%+99%+~98%

关键洞察:Kimi 系列在中文理解(CMMLU)和数学推理(MATH)上成绩突出,长上下文检索(Needle-in-Haystack)几近满分——这正是其产品核心优势所在。

API Pricing(截至 2026 年 4 月)

模型输入 (元/1M tokens)输出 (元/1M tokens)备注
Moonshot-v1-8k1212基础版,快速推理
Moonshot-v1-32k2424中长上下文
Moonshot-v1-128k6060长上下文标准版
Kimi k2待定待定最新旗舰,尚未全面开放 API

注:Moonshot 的 API 输入和输出价格相同(不区分输入/输出),以人民币计价。长期有开发者免费额度。

Product Ecosystem

月之暗面以 C 端产品驱动增长:

产品形态定位
Kimi 智能助手Web / App / 小程序通用 AI 助手,长文档分析,联网搜索
Kimi 浏览器插件Chrome / Edge 扩展网页摘要、划词翻译、全文分析
Kimi API开发者 API与 OpenAI 格式兼容,适合长文档处理场景
Kimi+内置应用商店Kimi 内的 Agent 生态(功能插件化)

Moonshot vs Peer Comparison

月之暗面在中国大模型"六小龙"中的独特定位:

维度Moonshot (Kimi)Zhipu AIDeepSeek
核心策略C 端爆款产品开源 + B 端平台极致技术效率 + 开源
技术差异化长上下文 + 推理GLM 架构统一MoE + MLA
开源态度闭源部分开源 (ChatGLM-6B)完全开源 (Apache 2.0)
主要产品Kimi 助手 (日活千万级)智谱清言 + APIDeepSeek Chat + API
估值~$3B~$2.5B未融资(幻方孵化)

Why It Matters

  • 定义长上下文产品的范式:Kimi 是中国市场第一个让"传 200 万字文档"成为大众认知的 AI 产品,证明了长上下文是驱动用户增长的有效差异化
  • C 端产品路线的标杆:与大多数中国 AI 公司走 B 端 API 路线不同,Moonshot 证明了 C 端 AI 助手可以通过产品体验获得海量用户
  • 学术纯度到产品的完整闭环:杨植麟从 Transformer-XL、XLNet 的学术贡献者到创办产品公司,代表了 AI 学术与产业融合的最佳实践
  • 推理模型的中国对标:k1.5/k2 是对 OpenAI o1/o3 和 DeepSeek-R1 的中国回应

Relationships

Open Questions

  • Kimi k2 的 1M 上下文在真实复杂任务(非 Needle-in-Haystack)中的可靠性如何?
  • 月之暗面是否会走向开源?C 端产品路线的壁垒是否足以抵抗开源模型的冲击?
  • 随着 DeepSeek 在推理模型上领先、ByteDance 在流量上碾压,Moonshot 的差异化能否持续?
  • 杨植麟的学术背景如何持续转化为产品竞争力?后续技术路线是继续长上下文还是转向多模态/Agent?

Sources

AI Knowledge Base — 持续积累