Skip to content

OpenAI

Overview

OpenAI 是当前生成式 AI 浪潮中最关键的公司之一,总部位于旧金山。采用 nonprofit foundation 与 for-profit Public Benefit Corporation 并存的治理结构,长期处于大语言模型、多模态模型和 API 平台的产业中心。截至 2026 年,其估值超过 $3000 亿,是全球最具影响力的 AI 公司。

Model Timeline

模型发布时间参数规模上下文窗口架构特点
GPT-32020-06175B2K纯 Decoder-only Transformer
GPT-3.5 / InstructGPT2022-03175B4KRLHF 对齐,ChatGPT 基础
GPT-42023-03约 1.8T (传闻 8×220B MoE)8K / 32K传闻 MoE 架构,多模态输入
GPT-4 Turbo2023-11同上128K更长的上下文、更低价格
GPT-4o2024-05未公开128K原生多模态(文本+图像+音频),速度 2x
o1-preview / o12024-09未公开128K推理链增强(Chain-of-Thought),数学/代码突破
o3-mini2025-01未公开128K轻量推理模型,高性价比
GPT-4o-mini2024-07约 8B128K低成本轻量模型
o4-mini2025-03未公开128K小型推理模型,价格更低

Benchmark Scores

基准GPT-4oo1o3-mini
MMLU (0-shot)88.7%92.3%86.5%
HumanEval90.2%92.4%85.1%
MATH76.6%94.8%89.3%
GPQA Diamond53.6%77.3%62.5%
HellaSwag95.3%96.2%93.8%
TruthfulQA73.9%78.0%71.2%

API Pricing(截至 2026 年 4 月)

模型输入 ($/1M tokens)输出 ($/1M tokens)备注
GPT-4o$2.50$10.00主力多模态模型
GPT-4o-mini$0.15$0.60高性价比
o1$15.00$60.00高推理能力
o3-mini$1.10$4.40轻量推理
o4-mini$0.55$2.20超轻量推理
GPT-4 Turbo$10.00$30.00已逐步淘汰

Architecture Notes

  • GPT-4o 采用原生多模态架构:统一处理文本、图像、音频输入,非简单拼接
  • o1 系列引入推理模式:在生成前进行内部推理链,大幅提升数学/代码/科学推理
  • GPT-4(传闻)为 8×220B MoE,总参数约 1.8T,激活参数约 280B — 但 OpenAI 官方从未确认
  • GPT-4o 的上下文窗口为 128K tokens
  • GPT-4o-mini 约 8B 参数,性能接近原始 GPT-4

Why It Matters

  • OpenAI 是理解闭源通用模型路线的关键入口
  • 它与 AnthropicDeepSeekQwen 的对比,有助于理解闭源与开源、产品化与研究化之间的差异
  • OpenAI 的"产品广度优先"策略(ChatGPT、DALL-E、Sora、GPTs、Operator)定义了 AI 产品化的最高标准
  • o1 系列开辟了"推理模型"新范式,改变了 benchmark 竞争格局

Relationships

Open Questions

  • OpenAI 的产品策略与 API 平台策略如何继续分化?
  • 下一代 GPT(GPT-5)的架构突破方向是什么?
  • OpenAI 的闭源策略在面对开源模型(LlamaQwenDeepSeek)持续逼近时如何保持差异化?

Sources

  • raw/articles/openai-wikipedia-summary-2026-04-26.md
  • raw/articles/openai-github-org-2026-04-26.md
  • OpenAI Platform Documentation (platform.openai.com)
  • OpenAI Research Papers (GPT-4, o1 System Card)

AI Knowledge Base — 持续积累