Moonshot AI (月之暗面)

中国最受瞩目的 AI 创业公司之一，由清华叉院出身的杨植麟创办。Kimi 智能助手是国内用户增长最快的 AI 产品，以超长上下文（200K+ tokens）和深度推理能力著称。Moonshot AI 是中国大模型"六小龙"之一。

Overview

月之暗面（Moonshot AI）成立于 2023 年 3 月，由杨植麟（清华大学交叉信息研究院校友、CMU 博士、Transformer-XL / XLNet 合著者）创办。公司名称源于 Pink Floyd 专辑《The Dark Side of the Moon》，寓意探索未知。

截至 2026 年，Moonshot AI 累计融资超过 10 亿美元，投资方包括阿里巴巴、红杉中国、美团、小红书等，估值约 30-33 亿美元。旗下产品 Kimi 智能助手 自 2023 年 10 月上线以来，凭借长上下文能力和强大的推理性能，成为中国日活最高的 AI 对话产品之一。

公司的核心差异化在于：长上下文技术（从 20 万字到 200 万字，行业最早之一）、专注 C 端体验的用户产品思维、以及从基础研究到产品化的完整闭环。

Model Timeline

模型	发布时间	参数规模	上下文窗口	特点
Moonshot-v1	2023-10	未公开	128K	初代长上下文模型，支持 20 万字输入
Moonshot-v1 (200K)	2024-02	未公开	200K	上下文扩展至 200K tokens，行业领先
Kimi k1.5	2025-01	未公开（MoE 估计）	128K	推理增强版，基于 RL 训练，对标 o1/R1
Kimi k2	2025-06 (估计)	未公开	1M	最新旗舰，1M 上下文 + 强推理能力
Moonshot-v1-8k/32k	2023/2024	未公开	8K/32K	API 快速版，降低成本

注：Moonshot AI 未公开绝大多数模型的技术参数，上述部分参数来自社区估计和分析报告。

Architecture Innovation

月之暗面在模型架构和长上下文技术上的核心贡献：

Infini-attention / 无限注意力：杨植麟在 Google 期间参与的研究方向，实现 Transformer 在理论上无限长的上下文处理而不增加计算复杂度。Kimi 的超长上下文能力可能继承了这一研究方向
压缩式记忆机制：通过 Transformer-XL 式的段级循环（segment-level recurrence）和压缩记忆，使模型能低成本处理超长文本
"注意力平权"理念：Kimi 团队提出的产品理念——让模型平等对待长文本中的每一部分，而非只关注开头和结尾
RL inference scaling：k1.5 采用强化学习训练推理链，类似 o1/R1 的 test-time compute scaling

Benchmark 表现

注：Moonshot 不公开标准基准评测数据，以下为社区测评和公开报告的汇总估计：

基准	Kimi k1.5	Kimi k2	GPT-4o（参考）
MMLU	~86%	~89%	88.7%
HumanEval	~82%	~88%	90.2%
MATH	~92%	~94%	76.6%
CMMLU (中文)	~90%	~92%	76.0%
长上下文检索 (Needle-in-Haystack)	99%+	99%+	~98%

关键洞察：Kimi 系列在中文理解（CMMLU）和数学推理（MATH）上成绩突出，长上下文检索（Needle-in-Haystack）几近满分——这正是其产品核心优势所在。

API Pricing（截至 2026 年 4 月）

模型	输入 (元/1M tokens)	输出 (元/1M tokens)	备注
Moonshot-v1-8k	12	12	基础版，快速推理
Moonshot-v1-32k	24	24	中长上下文
Moonshot-v1-128k	60	60	长上下文标准版
Kimi k2	待定	待定	最新旗舰，尚未全面开放 API

注：Moonshot 的 API 输入和输出价格相同（不区分输入/输出），以人民币计价。长期有开发者免费额度。

Product Ecosystem

月之暗面以 C 端产品驱动增长：

产品	形态	定位
Kimi 智能助手	Web / App / 小程序	通用 AI 助手，长文档分析，联网搜索
Kimi 浏览器插件	Chrome / Edge 扩展	网页摘要、划词翻译、全文分析
Kimi API	开发者 API	与 OpenAI 格式兼容，适合长文档处理场景
Kimi+	内置应用商店	Kimi 内的 Agent 生态（功能插件化）

Moonshot vs Peer Comparison

月之暗面在中国大模型"六小龙"中的独特定位：

维度	Moonshot (Kimi)	Zhipu AI	DeepSeek
核心策略	C 端爆款产品	开源 + B 端平台	极致技术效率 + 开源
技术差异化	长上下文 + 推理	GLM 架构统一	MoE + MLA
开源态度	闭源	部分开源 (ChatGLM-6B)	完全开源 (Apache 2.0)
主要产品	Kimi 助手 (日活千万级)	智谱清言 + API	DeepSeek Chat + API
估值	~$3B	~$2.5B	未融资（幻方孵化）

Why It Matters

定义长上下文产品的范式：Kimi 是中国市场第一个让"传 200 万字文档"成为大众认知的 AI 产品，证明了长上下文是驱动用户增长的有效差异化
C 端产品路线的标杆：与大多数中国 AI 公司走 B 端 API 路线不同，Moonshot 证明了 C 端 AI 助手可以通过产品体验获得海量用户
学术纯度到产品的完整闭环：杨植麟从 Transformer-XL、XLNet 的学术贡献者到创办产品公司，代表了 AI 学术与产业融合的最佳实践
推理模型的中国对标：k1.5/k2 是对 OpenAI o1/o3 和 DeepSeek-R1 的中国回应

Relationships

中国竞争对手：Zhipu AI、DeepSeek、Qwen、ByteDance
国际对标：OpenAI、Anthropic
相关概念：Chain-of-Thought & Reasoning、Transformer Architecture、Model Context Protocol (MCP)、Scaling Laws
投资方关系：阿里巴巴同时也是 Qwen 的母公司

Open Questions

Kimi k2 的 1M 上下文在真实复杂任务（非 Needle-in-Haystack）中的可靠性如何？
月之暗面是否会走向开源？C 端产品路线的壁垒是否足以抵抗开源模型的冲击？
随着 DeepSeek 在推理模型上领先、ByteDance 在流量上碾压，Moonshot 的差异化能否持续？
杨植麟的学术背景如何持续转化为产品竞争力？后续技术路线是继续长上下文还是转向多模态/Agent？

Sources

Kimi 官方网站
Moonshot AI 官方博客
杨植麟学术主页（Google Scholar）
媒体公开报道（36氪、LatePost、机器之心等）
Large Language Model (LLM) — 大语言模型的核心定义、技术原理与发展历程

Moonshot AI (月之暗面) ​

Overview ​

Model Timeline ​

Architecture Innovation ​

Benchmark 表现 ​

API Pricing（截至 2026 年 4 月） ​

Product Ecosystem ​

Moonshot vs Peer Comparison ​

Why It Matters ​

Relationships ​

Open Questions ​

Sources ​