Skip to content

概念

AI / LLM 领域的核心技术概念,从底层架构到上层应用系统化组织。

模型架构

大模型的基础结构设计——模型"长什么样"。

训练方法论

模型如何学习和优化——从数据到参数。

  • Fine-tuning — 在预训练模型基础上用特定数据继续训练以实现定向适配。
  • RLHF — 基于人类偏好对齐模型的训练方法论。
  • DPO & Preference Alignment — 无需奖励模型的直接偏好优化对齐方法。
  • Synthetic Data — 由 AI 生成的训练数据,自我对弈、拒绝采样与数据增强范式。
  • Knowledge Distillation — 知识蒸馏——将大型教师模型的能力迁移至小型学生模型的技术。
  • Scaling Laws — 模型性能随参数、数据和计算量可预测增长的幂律理论。

推理与生成

模型如何产出结果——从 Token 到部署。

应用与系统工程

模型在实际系统中的落地、治理与生态。

AI Knowledge Base — 持续积累