Appearance
Zhipu AI (智谱 AI)
中国最具代表性的 AI 大模型创业公司之一,由清华大学知识工程实验室(KEG)孵化,以 GLM(General Language Model)架构和 ChatGLM 开源系列著称。智谱 AI 是国内少数在基座模型、多模态能力和 Agent 平台三个维度均达到第一梯队水平的公司。
Overview
智谱 AI(Zhipu AI)成立于 2019 年,源自清华大学计算机系知识工程实验室(KEG),核心团队包括唐杰、张鹏等人。公司采用 "基础模型 + 行业应用" 双轮驱动策略:一方面开源轻量级模型推动生态建设,另一方面通过智谱清言(ChatGLM 应用)和 MaaS 平台实现商业化。
截至 2026 年,智谱 AI 累计融资超过 25 亿人民币,投资方包括阿里、腾讯、美团、小米、红杉中国等。估值超过 200 亿人民币,是中国大模型 "六小龙" 之一(与月之暗面、百川智能、零一万物、阶跃星辰、MiniMax 并列)。
GLM Architecture
智谱 AI 的核心技术差异化在于 GLM(General Language Model)架构——一种将自回归填空与自回归生成统一的预训练框架:
- UniLM 思路演进:GLM 通过二维位置编码和自回归空白填充(autoregressive blank infilling),让单一模型同时掌握双向理解和单向生成能力
- 训练效率:相比传统 GPT 纯自回归架构,GLM 在相同参数规模下训练数据效率更高
- 长文本优化:通过位置编码外推和稀疏注意力机制,GLM 系列原生支持 128K–1M tokens 的长上下文
Model Timeline
| 模型 | 发布时间 | 参数规模 | 上下文窗口 | 特点 |
|---|---|---|---|---|
| GLM-10B | 2022-08 | 10B | 2K | 初代 GLM,验证架构可行性 |
| ChatGLM-6B | 2023-03 | 6B | 2K | 首个开源中文对话模型,社区影响巨大 |
| ChatGLM2-6B | 2023-06 | 6B | 32K | 升级 FlashAttention,推理速度大幅提升 |
| ChatGLM3-6B | 2023-10 | 6B | 32K | 加入工具调用(Function Calling)能力 |
| GLM-4 | 2024-01 | 未公开(估计 50B+) | 128K | 旗舰闭源模型,对标 GPT-4 |
| GLM-4-9B | 2024-06 | 9B | 128K | 开源版本,多语言、多模态 |
| GLM-4-Plus | 2024-09 | 未公开 | 128K | 推理增强版,对标 Claude 3.5 |
| GLM-4.5 / GLM-5 | 2025 | 未公开 | 1M | 最新旗舰,支持超长上下文 |
| GLM-4-V | 2024 | 9B | 8K | 视觉语言模型,图像理解 |
| CodeGeeX | 持续迭代 | 6B–13B | 8K | 代码生成模型,VS Code 插件月活超百万 |
开源生态
智谱 AI 是中国大模型公司中开源策略最积极的之一:
- ChatGLM-6B 系列:GitHub Stars 超过 40,000,是国内 Stars 数最高的开源大模型 repo 之一
- CodeGeeX:开源代码生成模型,支持 20+ 编程语言,IDE 插件下载量超 500 万
- CogVLM / CogAgent:开源视觉语言模型,采用视觉专家架构,在 OCR 和 GUI 理解上表现突出
- 开源许可:学术/研究免费,商用需申请授权(比 Llama 2 更宽松,比 Apache 2.0 略严格)
商业化产品
| 产品 | 形态 | 定位 |
|---|---|---|
| 智谱清言 | C 端 App / Web | 通用 AI 助手,国内日活前列 |
| GLM API / MaaS | 开发者 API | 模型即服务平台,按量计费 |
| CodeGeeX | IDE 插件 / API | 编程辅助,VS Code / JetBrains |
| 智谱 Agent 平台 | B 端平台 | 企业级 Agent 构建与部署 |
Benchmark 表现
| 基准 | GLM-4 | GLM-4-Plus | GPT-4o | Claude 3.5 Sonnet |
|---|---|---|---|---|
| MMLU | 81.5% | 85.2% | 88.7% | 88.7% |
| CMMLU (中文) | 84.0% | 87.5% | 76.0% | 75.0% |
| C-Eval (中文) | 81.1% | 85.0% | 69.9% | 68.0% |
| HumanEval | 72.6% | 80.1% | 90.2% | 92.0% |
| GSM8K (数学) | 78.5% | 85.0% | 95.3% | 96.4% |
关键洞察:GLM-4 系列在中文理解(CMMLU、C-Eval)上显著优于国际模型,但在代码(HumanEval)和数学(GSM8K)上仍有差距。GLM-4-Plus 在推理能力上已接近 Claude 3.5 水平。
API Pricing(截至 2026 年 4 月)
| 模型 | 输入 (元/1M tokens) | 输出 (元/1M tokens) | 备注 |
|---|---|---|---|
| GLM-4-Plus | 50 | 150 | 最新旗舰 |
| GLM-4 | 30 | 100 | 标准版 |
| GLM-4-9B | 免费 | 免费 | 开源模型,API 免费额度 |
| GLM-4-V (视觉) | 50 | 150 | 图像理解 |
注:智谱 API 以人民币计价,价格策略较 OpenAI 显著更低,是国内开发者的主流选择之一。
Relationships
- 相关公司:OpenAI、DeepSeek、Qwen、[[baichuan]]、[[moonshot]]
- 相关概念:Transformer Architecture、Retrieval Augmented Generation、AI Agents、Multimodal Models、Fine-tuning
- 竞争关系:与 Qwen(阿里云)和 DeepSeek 构成国内开源大模型的 "三国杀"
Why It Matters
- 中文开源生态的基石:ChatGLM-6B 是很多中国开发者的第一个本地大模型,其开源策略直接推动了国内 LLM 应用层的繁荣
- GLM 架构的学术价值:作为非 GPT 架构的代表,GLM 证明了双向-单向统一预训练的可行性,为架构多样性提供了重要参考
- 端侧部署优势:9B 级别的开源模型(GLM-4-9B)在消费级 GPU 甚至高端 CPU 上可流畅运行,适合私有化部署
- Agent 平台竞争:智谱的 Agent 构建平台与 Model Context Protocol (MCP) 生态正在形成互补关系
Open Questions
- GLM 架构在长上下文(1M tokens)场景下能否持续保持对 GPT/Claude 架构的效率优势?
- 智谱如何在开源策略(扩大影响力)和商业化(变现压力)之间取得平衡?
- 面对 DeepSeek 在推理模型上的突破,GLM 系列的推理能力追赶计划是什么?
- 国际市场对智谱模型的接受度受地缘政治影响有多大?出海策略能否成功?