OpenAI

Overview

OpenAI 是当前生成式 AI 浪潮中最关键的公司之一，总部位于旧金山。采用 nonprofit foundation 与 for-profit Public Benefit Corporation 并存的治理结构，长期处于大语言模型、多模态模型和 API 平台的产业中心。截至 2026 年，其估值超过 $3000 亿，是全球最具影响力的 AI 公司。

Model Timeline

模型	发布时间	参数规模	上下文窗口	架构特点
GPT-3	2020-06	175B	2K	纯 Decoder-only Transformer
GPT-3.5 / InstructGPT	2022-03	175B	4K	RLHF 对齐，ChatGPT 基础
GPT-4	2023-03	约 1.8T (传闻 8×220B MoE)	8K / 32K	传闻 MoE 架构，多模态输入
GPT-4 Turbo	2023-11	同上	128K	更长的上下文、更低价格
GPT-4o	2024-05	未公开	128K	原生多模态（文本+图像+音频），速度 2x
o1-preview / o1	2024-09	未公开	128K	推理链增强（Chain-of-Thought），数学/代码突破
o3-mini	2025-01	未公开	128K	轻量推理模型，高性价比
GPT-4o-mini	2024-07	约 8B	128K	低成本轻量模型
o4-mini	2025-03	未公开	128K	小型推理模型，价格更低

Benchmark Scores

基准	GPT-4o	o1	o3-mini
MMLU (0-shot)	88.7%	92.3%	86.5%
HumanEval	90.2%	92.4%	85.1%
MATH	76.6%	94.8%	89.3%
GPQA Diamond	53.6%	77.3%	62.5%
HellaSwag	95.3%	96.2%	93.8%
TruthfulQA	73.9%	78.0%	71.2%

API Pricing（截至 2026 年 4 月）

模型	输入 ($/1M tokens)	输出 ($/1M tokens)	备注
GPT-4o	$2.50	$10.00	主力多模态模型
GPT-4o-mini	$0.15	$0.60	高性价比
o1	$15.00	$60.00	高推理能力
o3-mini	$1.10	$4.40	轻量推理
o4-mini	$0.55	$2.20	超轻量推理
GPT-4 Turbo	$10.00	$30.00	已逐步淘汰

Architecture Notes

GPT-4o 采用原生多模态架构：统一处理文本、图像、音频输入，非简单拼接
o1 系列引入推理模式：在生成前进行内部推理链，大幅提升数学/代码/科学推理
GPT-4（传闻）为 8×220B MoE，总参数约 1.8T，激活参数约 280B — 但 OpenAI 官方从未确认
GPT-4o 的上下文窗口为 128K tokens
GPT-4o-mini 约 8B 参数，性能接近原始 GPT-4

Why It Matters

OpenAI 是理解闭源通用模型路线的关键入口
它与 Anthropic、DeepSeek、Qwen 的对比，有助于理解闭源与开源、产品化与研究化之间的差异
OpenAI 的"产品广度优先"策略（ChatGPT、DALL-E、Sora、GPTs、Operator）定义了 AI 产品化的最高标准
o1 系列开辟了"推理模型"新范式，改变了 benchmark 竞争格局

Relationships

相关公司：Anthropic、DeepSeek、Qwen、Google DeepMind
相关概念：AI Agents、Retrieval Augmented Generation、Transformer Architecture、RLHF、Multimodal Models、Harness Engineering

Open Questions

OpenAI 的产品策略与 API 平台策略如何继续分化？
下一代 GPT（GPT-5）的架构突破方向是什么？
OpenAI 的闭源策略在面对开源模型（Llama、Qwen、DeepSeek）持续逼近时如何保持差异化？

Sources

raw/articles/openai-wikipedia-summary-2026-04-26.md
raw/articles/openai-github-org-2026-04-26.md
OpenAI Platform Documentation (platform.openai.com)
OpenAI Research Papers (GPT-4, o1 System Card)
Large Language Model (LLM) — 大语言模型的核心定义、技术原理与发展历程