Skip to content

Emergent Abilities / Grokking

大语言模型中"量变引起质变"现象的两种表现形式——规模涌现与训练涌现,揭示了神经网络能力涌现的深层机制。

概述

Emergent Abilities(涌现能力)和 Grokking(顿悟)是深度学习领域两个描述"突然跃迁"现象的核心概念。前者关注模型规模扩大带来的能力质变,后者关注训练过程中从记忆到理解的突然转变。两者共同挑战了"能力随规模/时间线性增长"的直觉,为理解大模型"为什么突然变聪明"提供了关键视角。

Emergent Abilities: 规模涌现

核心定义

由 Google Research 的 Jason Wei 等人于 2022 年提出。一个能力被称为"涌现",当且仅当:

该能力在较小模型中不存在,但在较大模型中突然出现。

这意味着无法通过外推小模型的性能来预测大模型何时会获得该能力。

典型涌现能力示例

  • ** few-shot 提示**: 小模型无法从示例中学习,大模型可以
  • 思维链推理 (Chain-of-Thought): 小模型不能逐步推理,大模型突然可以
  • 指令遵循: 小模型不理解自然语言指令,大模型可以理解并执行
  • 多步算术: 小模型无法完成多步计算,大模型突然可以
  • 代码生成: 小模型只能生成片段,大模型可以生成完整可运行程序

争议:涌现是真实的吗?

2023 年 Stanford 的 Schaeffer 等人在 NeurIPS (Spotlight) 上发表质疑:

"涌现能力可能只是一种测量伪影 (measurement artifact)。"

核心论点:

  • 使用非线性/不连续指标(如多选题准确率、精确匹配)时,能力看起来是"突然涌现"的
  • 改用线性/连续指标(如 token-level 交叉熵、Brier 分数)时,能力增长变得平滑且可预测
  • 因此,"涌现"可能源于评估指标的选择,而非模型本身的相变

这一争论至今仍在持续,但无论如何,从应用视角看,大模型确实在特定规模阈值后表现出 qualitatively different 的行为。

Grokking: 训练顿悟

核心定义

由 DeepMind 的 Power 等人于 2022 年发现并命名。Grokking 描述的是训练过程中的一个反直觉现象:

模型首先过拟合训练数据(训练准确率很高,验证准确率很低),但在继续训练很长时间后,验证准确率突然大幅提升——模型从"记忆"转变为"理解"。

关键特征

  • 延迟泛化: 泛化不是发生在训练早期,而是在严重过拟合之后
  • 突然转变: 验证准确率不是渐进提升,而是突然跃迁
  • 与规模相关: 更大的模型、合适的正则化(如权重衰减)更容易出现 Grokking
  • 任务特定: 在算法数据集(如模加法、排列组合)上最明显

可能机制

Grokking 被认为源于模型内部表示的结构性转变

  1. 早期: 模型记忆训练样本(lookup table 式表示)
  2. 中期: 持续训练迫使模型寻找更紧凑的表示
  3. 后期: 模型"发现"了底层算法结构,泛化能力突然解锁

这与人类学习中的"顿悟"(Aha! moment)有惊人的相似性。

两者关联:为什么"量变引起质变"

维度Emergent AbilitiesGrokking
变量模型规模 (参数/数据/计算)训练时间 (优化步数)
方向横向扩展纵向深入
现象新能力突然出现从记忆突然转变为理解
质疑是否只是评估指标的伪影?是否广泛存在于大规模模型?
启示规模扩展可能带来不可预测的新能力持续训练可能解锁隐藏泛化能力

两者共同指向一个深层问题:神经网络的能力空间可能不是连续的,而是存在相变式的跃迁。

对 AI 发展的启示

  1. 预测困难: 无法简单通过小模型外推大模型能力,需要实际训练验证
  2. 安全考量: 涌现能力可能包括不可预测的有害能力(如欺骗、操纵)
  3. 训练策略: Grokking 提示我们,"过拟合"不一定是终点,持续训练可能带来意外收获
  4. 评估指标: 指标选择会深刻影响我们对模型能力的认知

关键论文

论文作者年份链接
Emergent Abilities of Large Language ModelsWei et al. (Google/Stanford/DeepMind)2022 (TMLR)arXiv
Grokking: Generalization Beyond Overfitting on Small Algorithmic DatasetsPower et al. (DeepMind)2022arXiv
Are Emergent Abilities of Large Language Models a Mirage?Schaeffer et al. (Stanford)2023 (NeurIPS)arXiv

相关概念

AI Knowledge Base — 持续积累