Appearance
MiniMax
中国最具多模态野心的 AI 公司之一,由前商汤高管闫俊杰创办。以海螺 AI(Hailuo AI)产品矩阵和自研 Lightning Attention 架构著称,同时覆盖文本、语音、视频、音乐等多个模态。Talkie 出海应用在全球 C.ai 类产品中排名前列。
Overview
MiniMax 成立于 2021 年 12 月,由前商汤科技副总裁闫俊杰(Yan Junjie)创办。公司从成立之初就定位于"多模态 AI 平台",不走单一模态的路线——这与大多数从文本 LLM 起家的 AI 公司形成鲜明差异。
截至 2026 年,MiniMax 累计融资超过 8.5 亿美元,投资方包括阿里巴巴、腾讯、Hillhouse、红杉中国、IDG 等,估值约 25-30 亿美元。公司员工约 600+ 人,研发占比超过 70%。
MiniMax 是中国大模型"六小龙"之一,也是其中唯一从一开始就多模态并行布局的公司。
Model Timeline
| 模型 | 发布时间 | 参数规模 | 模态 | 特点 |
|---|---|---|---|---|
| MiniMax-Text-01 | 2025-01 | 456B (45.9B 激活) MoE | 文本 | Lightning Attention,4M+ 上下文 |
| MiniMax-VL-01 | 2025-01 | 未公开 | 视觉+文本 | 多模态视觉语言模型 |
| MiniMax-Video-01 | 2024-08 | 未公开 | 文本→视频 | 首款商用视频生成模型 |
| MiniMax-Speech | 2023-2024 | 未公开 | TTS / STT | 语音合成与识别,音色克隆 |
| MiniMax-Music-01 | 2025 | 未公开 | 音乐生成 | 文本→音乐生成 |
| abab 5.5 / 6 / 6.5 | 2023-2024 | 未公开 | 文本 | 早期文本对话模型,产品内部代号 |
Lightning Attention(核心架构创新)
MiniMax 最重要的技术贡献是 Lightning Attention —— 一种线性注意力机制,从根本上解决了标准 Transformer 的 O(n²) 复杂度瓶颈:
- 原理:将标准 Softmax 注意力替换为基于核函数(kernel function)的线性注意力,使注意力计算复杂度从 O(n²d) 降为 O(nd²)
- 实现:首次证明线性注意力在千亿参数规模可以匹敌甚至超越标准注意力(Softmax Attention)
- 长上下文优势:MiniMax-Text-01 在 4M+ token 上下文下仍能保持线性复杂度,推理成本和延迟远低于同长度下的标准 Transformer
- 学术验证:相关论文被顶会接收,是线性注意力从理论走向千亿级实践的关键里程碑
与 MLA 的对比:DeepSeek 的 MLA(Multi-Head Latent Attention)通过低秩压缩优化 KV cache,而 MiniMax 的 Lightning Attention 通过核函数近似实现线性复杂度——两者都是突破 Transformer O(n²) 瓶颈的重要路径。
Product Ecosystem
| 产品 | 形态 | 定位 | 日活/用户量 |
|---|---|---|---|
| 海螺 AI (Hailuo AI) | App / Web | 多模态 AI 助手,支持对话、画图、视频、音乐 | 国内日活百万级 |
| Talkie | App | 出海 AI 角色扮演/聊天(C.ai 竞品) | 全球月活千万级 |
| Hailuo Video | Web 工具 | AI 视频生成,文本/图片→视频 | 免费使用 |
| MiniMax API | 开发者 API | 文本/语音/视频 API 平台 | B 端开发者 |
| 海螺音乐 | 功能模块 | 文本→音乐生成,包含歌词编写 | 内置功能 |
关键差异化:Talkie 是中国 AI 公司最成功的出海 C 端应用之一,在北美/东南亚的 AI 聊天类应用中排名稳定前列,验证了 MiniMax 的全球化产品能力。
API Pricing(截至 2026 年 4 月)
| 模型 | 输入 (元/1M tokens) | 输出 (元/1M tokens) | 备注 |
|---|---|---|---|
| MiniMax-Text-01 | 1 | 8 | 性价比极高(国内最低) |
| MiniMax-VL-01 | 待定 | 待定 | 视觉理解 API |
| 语音合成 | 按字符/时长计费 | — | TTS API |
| 视频生成 | 按秒计费 | — | 5 秒/段起 |
注:MiniMax API 以人民币计价,Text-01 定价策略极为激进(输入仅 1 元/1M tokens),是国内文本 API 价格战的主要推动者之一。
Benchmark 表现(MiniMax-Text-01)
| 基准 | MiniMax-Text-01 | DeepSeek-V3 | GPT-4o |
|---|---|---|---|
| MMLU | 88.5% | 88.5% | 88.7% |
| HumanEval | 86.5% | 82.6% | 90.2% |
| MATH | 78.0% | 79.2% | 76.6% |
| GPQA Diamond | 54.3% | 59.1% | 53.6% |
| MMLU-Pro | 63.0% | 64.4% | — |
关键洞察:MiniMax-Text-01 在通用文本能力上基本对标 DeepSeek-V3,但价格仅为后者的几分之一。在代码能力(HumanEval 86.5%)上表现尤为突出。
International Presence
MiniMax 是中国 AI 公司中全球化最成功的之一:
- Talkie:面向北美/东南亚/中东的 AI 角色扮演 App,全球下载量超千万,是出海 AI 社交产品 Top 3
- 海外 API:MiniMax API 支持海外调用,文档提供中英双语
- 本地化能力:语音合成支持 50+ 语言,情感表达丰富度业内领先
- YouTube 创作者生态:Hailuo Video 被海外 YouTuber 广泛用于视频创作
Why It Matters
- 多模态全栈的最清晰案例:同时布局文本、视觉、语音、视频四个核心模态,且每个都有商用产品——这在全球也属罕见
- Lightning Attention 的工业验证:首次证明了线性注意力在千亿级模型上可以匹配甚至超越标准注意力,对后续架构演进有深远影响
- 极致性价比的价格战先锋:MiniMax-Text-01 把文本 API 价格打到 1 元/1M tokens 的极端位置,客观上加速了中国 AI 的平民化
- 出海能力验证:Talkie 的成功证明了中国 AI 公司完全可以在 C 端全球市场与 Character.AI 等产品竞争
Relationships
- 中国竞争对手:Zhipu AI、DeepSeek、Qwen、Moonshot AI (月之暗面)、ByteDance
- 多模态生态伙伴:与 Stable Diffusion / Sora 等形成互补/竞争关系
- 相关概念:Transformer Architecture、Mixture of Experts、Multimodal Models、Model Inference & Deployment
- 架构对比:Lightning Attention vs DeepSeek 的 MLA
Open Questions
- Lightning Attention 在更复杂的推理任务(如数学、代码)上能否长期保持竞争力?是否能支持类似 o1/R1 的 test-time compute scaling?
- 多模态全栈布局是否会导致资源分散?MiniMax 能在文本、视频、语音每个细分都做到第一梯队吗?
- 出海数据合规(GDPR、各国 AI 法规)对 Talkie 的长期增长构成多大风险?
- 当 ByteDance 豆包 App 的日均几千万活跃用户碾压所有竞品时,MiniMax 的差异化能否维持?
Sources
MiniMax-01 paper (Lightning Attention)
Talkie App (Google Play / App Store)
Large Language Model (LLM) — 大语言模型的核心定义、技术原理与发展历程