Skip to content

概念

AI / LLM 领域的核心技术概念,从底层架构到上层应用系统化组织。

模型架构

大模型的基础结构设计——模型"长什么样"。

  • Large Language Model (LLM) — 大语言模型的核心定义、技术原理、发展历程与关键能力。
  • Transformer Architecture — 现代大模型的基础架构范式。
  • Attention Mechanism — Transformer 的核心计算单元,现代大语言模型能力的基础。
  • Position Encoding — 为 Transformer 模型提供序列位置信息的技术,从正弦位置编码到 RoPE 的演进。
  • RoPE (Rotary Position Embedding) — RoPE,通过旋转矩阵将位置信息编码到注意力计算中的相对位置表示方法,当前主流标准。
  • Mixture of Experts — 用稀疏专家激活提升模型容量与效率的架构思路。
  • Multimodal Models — 跨文本、图像、音频、视频的多模态 AI 架构与能力。
  • Diffusion Models — 去噪扩散概率模型,现代图像/视频/音频生成(Stable Diffusion、Sora)的基础。
  • Mamba / State Space Models —— Mamba / 状态空间模型,以线性复杂度和选择性注意力挑战 Transformer 的新架构。
  • Mixture of Depths (MoD) —— 深度维度的动态计算分配,与 MoE 正交的 Transformer 稀疏化新方向。
  • World Models —— 能够学习并模拟环境动态规律的生成式 AI 模型,从像素到 3D 空间,从预测到交互。
  • 自回归、扩散模型与 Flow Matching —— 生成式 AI 三大范式对比:自回归(GPT)、扩散模型(Stable Diffusion)与 Flow Matching(FLUX.1、Stable Diffusion 3)的原理对比与应用场景。
  • NeRF / 3D Gaussian Splatting —— 从隐式神经表示到显式高斯点云的 3D 场景重建与新视角合成,空间智能与 World Models 的核心视觉基础。
  • Prefix LM vs Causal LM —— Transformer 两大核心注意力架构范式对比,理解 T5 与 GPT 的设计差异。

训练方法论

模型如何学习和优化——从数据到参数。

  • Fine-tuning — 在预训练模型基础上用特定数据继续训练以实现定向适配。
  • RLHF — 基于人类偏好对齐模型的训练方法论。
  • DPO & Preference Alignment — 无需奖励模型的直接偏好优化对齐方法。
  • Constitutional AI / RLAIF — 利用 AI 自身判断来对齐模型行为的方法论,比 RLHF 更可扩展。
  • Synthetic Data — 由 AI 生成的训练数据,自我对弈、拒绝采样与数据增强范式。
  • Knowledge Distillation — 知识蒸馏——将大型教师模型的能力迁移至小型学生模型的技术。
  • Model Merging — 将多个训练好的模型或适配器合并为一个新模型的技术,开源社区独特能力。
  • Scaling Laws —— 模型性能随参数、数据和计算量可预测增长的幂律理论。
  • Emergent Abilities / Grokking —— 大模型涌现能力与训练顿悟现象,理解"量变引起质变"的深层机制。

推理与生成

模型如何产出结果——从 Token 到部署。

  • Chain-of-Thought & Reasoning — 思维链提示与推理模型——让 LLM 进行逐步推理的核心技术。
  • In-Context Learning — 大语言模型通过上下文示例学习新任务的能力,无需参数更新。
  • Temperature & Sampling Strategies — Temperature 与采样策略,控制 LLM 生成行为的随机性、多样性与准确性。
  • Tokenization — 将文本分割成 Token 的基础方法(BPE、SentencePiece 等)。
  • Model Quantization — 降低模型精度以减小体积、加速推理的核心技术。
  • KV Cache & Prompt Caching — Transformer 推理性能优化的核心技术,显著影响延迟和成本。
  • Speculative Decoding — 用小模型预测、大模型验证的推理加速技术,无损失 2-3x 速度提升。
  • FlashAttention — 通过 IO-Aware 的精确注意力计算显著加速 Transformer 训练与推理的算法突破。
  • Model Inference & Deployment — 模型推理优化技术与生产级部署框架。
  • Context Window — 大语言模型能处理的输入长度限制与长上下文技术进展。
  • 长上下文技术 — 从 2K 到 1M+ token 的技术演进:Ring Attention、YaRN、NTK-aware scaling 与位置编码扩展方法。

应用与系统工程

模型在实际系统中的落地与生态。

Agent Skills

将领域专业知识和工作流封装为 AI Agent 可动态加载的可移植能力包。

安全与评估

模型的可靠性、安全性与治理。

  • LLM Evaluation — LLM 评测体系与 EleutherAI LM Evaluation Harness 评估框架。
  • Red Teaming — 系统性挑战 AI 系统以发现潜在弱点的方法论。
  • Watermarking / AI Detection — AI 生成内容的水印与检测技术,涉及内容溯源、Deepfake 检测和政策合规。
  • AI Safety & Alignment — AI 安全研究、价值对齐、Constitutional AI 与治理框架。
  • AI Hallucination — LLM 产生虚假信息的现象、成因、检测与缓解策略。
  • Jailbreak 与 Prompt Injection — LLM 安全攻防核心概念:角色仿觃、目标劫持、直接/间接注入与防御机制。

生成与多模态

内容生成与跨模态能力。

AI Knowledge Base — 持续积累