Skip to content

Zhipu AI (智谱 AI)

中国最具代表性的 AI 大模型创业公司之一,由清华大学知识工程实验室(KEG)孵化,以 GLM(General Language Model)架构和 ChatGLM 开源系列著称。智谱 AI 是国内少数在基座模型、多模态能力和 Agent 平台三个维度均达到第一梯队水平的公司。

Overview

智谱 AI(Zhipu AI)成立于 2019 年,源自清华大学计算机系知识工程实验室(KEG),核心团队包括唐杰、张鹏等人。公司采用 "基础模型 + 行业应用" 双轮驱动策略:一方面开源轻量级模型推动生态建设,另一方面通过智谱清言(ChatGLM 应用)和 MaaS 平台实现商业化。

截至 2026 年,智谱 AI 累计融资超过 25 亿人民币,投资方包括阿里、腾讯、美团、小米、红杉中国等。估值超过 200 亿人民币,是中国大模型 "六小龙" 之一(与月之暗面、百川智能、零一万物、阶跃星辰、MiniMax 并列)。

GLM Architecture

智谱 AI 的核心技术差异化在于 GLM(General Language Model)架构——一种将自回归填空与自回归生成统一的预训练框架:

  • UniLM 思路演进:GLM 通过二维位置编码和自回归空白填充(autoregressive blank infilling),让单一模型同时掌握双向理解和单向生成能力
  • 训练效率:相比传统 GPT 纯自回归架构,GLM 在相同参数规模下训练数据效率更高
  • 长文本优化:通过位置编码外推和稀疏注意力机制,GLM 系列原生支持 128K–1M tokens 的长上下文

Model Timeline

模型发布时间参数规模上下文窗口特点
GLM-10B2022-0810B2K初代 GLM,验证架构可行性
ChatGLM-6B2023-036B2K首个开源中文对话模型,社区影响巨大
ChatGLM2-6B2023-066B32K升级 FlashAttention,推理速度大幅提升
ChatGLM3-6B2023-106B32K加入工具调用(Function Calling)能力
GLM-42024-01未公开(估计 50B+)128K旗舰闭源模型,对标 GPT-4
GLM-4-9B2024-069B128K开源版本,多语言、多模态
GLM-4-Plus2024-09未公开128K推理增强版,对标 Claude 3.5
GLM-4.5 / GLM-52025未公开1M最新旗舰,支持超长上下文
GLM-4-V20249B8K视觉语言模型,图像理解
CodeGeeX持续迭代6B–13B8K代码生成模型,VS Code 插件月活超百万

开源生态

智谱 AI 是中国大模型公司中开源策略最积极的之一:

  • ChatGLM-6B 系列:GitHub Stars 超过 40,000,是国内 Stars 数最高的开源大模型 repo 之一
  • CodeGeeX:开源代码生成模型,支持 20+ 编程语言,IDE 插件下载量超 500 万
  • CogVLM / CogAgent:开源视觉语言模型,采用视觉专家架构,在 OCR 和 GUI 理解上表现突出
  • 开源许可:学术/研究免费,商用需申请授权(比 Llama 2 更宽松,比 Apache 2.0 略严格)

商业化产品

产品形态定位
智谱清言C 端 App / Web通用 AI 助手,国内日活前列
GLM API / MaaS开发者 API模型即服务平台,按量计费
CodeGeeXIDE 插件 / API编程辅助,VS Code / JetBrains
智谱 Agent 平台B 端平台企业级 Agent 构建与部署

Benchmark 表现

基准GLM-4GLM-4-PlusGPT-4oClaude 3.5 Sonnet
MMLU81.5%85.2%88.7%88.7%
CMMLU (中文)84.0%87.5%76.0%75.0%
C-Eval (中文)81.1%85.0%69.9%68.0%
HumanEval72.6%80.1%90.2%92.0%
GSM8K (数学)78.5%85.0%95.3%96.4%

关键洞察:GLM-4 系列在中文理解(CMMLU、C-Eval)上显著优于国际模型,但在代码(HumanEval)和数学(GSM8K)上仍有差距。GLM-4-Plus 在推理能力上已接近 Claude 3.5 水平。

API Pricing(截至 2026 年 4 月)

模型输入 (元/1M tokens)输出 (元/1M tokens)备注
GLM-4-Plus50150最新旗舰
GLM-430100标准版
GLM-4-9B免费免费开源模型,API 免费额度
GLM-4-V (视觉)50150图像理解

注:智谱 API 以人民币计价,价格策略较 OpenAI 显著更低,是国内开发者的主流选择之一。

Relationships

Why It Matters

  • 中文开源生态的基石:ChatGLM-6B 是很多中国开发者的第一个本地大模型,其开源策略直接推动了国内 LLM 应用层的繁荣
  • GLM 架构的学术价值:作为非 GPT 架构的代表,GLM 证明了双向-单向统一预训练的可行性,为架构多样性提供了重要参考
  • 端侧部署优势:9B 级别的开源模型(GLM-4-9B)在消费级 GPU 甚至高端 CPU 上可流畅运行,适合私有化部署
  • Agent 平台竞争:智谱的 Agent 构建平台与 Model Context Protocol (MCP) 生态正在形成互补关系

Open Questions

  • GLM 架构在长上下文(1M tokens)场景下能否持续保持对 GPT/Claude 架构的效率优势?
  • 智谱如何在开源策略(扩大影响力)和商业化(变现压力)之间取得平衡?
  • 面对 DeepSeek 在推理模型上的突破,GLM 系列的推理能力追赶计划是什么?
  • 国际市场对智谱模型的接受度受地缘政治影响有多大?出海策略能否成功?

AI Knowledge Base — 持续积累