Skip to content

AI 学习资源导航

从入门到进阶的 AI 学习路径,涵盖经典论文、优质课程、活跃社区和知识追踪工具。

经典论文路线图

基础架构(必读)

论文年份贡献重要性
Attention Is All You Need2017提出 Transformer 架构⭐⭐⭐ 现代大模型基石
BERT: Pre-training of Deep Bidirectional Transformers2018双向编码预训练⭐⭐⭐ NLP 范式转变
Language Models are Few-Shot Learners (GPT-3)2020证明大规模上下文学习能力⭐⭐⭐ 涌现能力起点
Training language models to follow instructions (InstructGPT)2022RLHF 对齐方法⭐⭐⭐ ChatGPT 技术基础

扩展与效率

论文年份贡献
Scaling Laws for Neural Language Models2020规模定律系统研究
Switch Transformers2021大规模 MoE 实践
LoRA: Low-Rank Adaptation2021参数高效微调
QLoRA2023单卡微调大模型
FlashAttention2022内存高效 Attention

推理与 Agent

论文年份贡献
Chain-of-Thought Prompting2022推理链提示
Toolformer2023模型自学工具使用
ReAct2023推理+行动结合
Direct Preference Optimization (DPO)2023无需奖励模型的对齐
DeepSeek-R12025纯 RL 推理模型

多模态

论文年份贡献
CLIP2021视觉-语言对齐
LLaVA2023视觉指令微调
GPT-4V2023多模态大模型
Sora2024视频生成

论文获取渠道

在线课程

入门课程

课程平台讲师/机构特点
CS50's Introduction to AI with PythonedXHarvard零基础友好,Python 实践
Machine Learning SpecializationCourseraAndrew Ng经典入门,系统全面
Deep Learning SpecializationCourseraAndrew Ng深度学习基础
Fast.ai Practical Deep Learningfast.aiJeremy Howard实战导向,自上而下

大模型专项

课程平台特点
CS224N: NLP with Deep LearningStanfordTransformer、预训练、微调
CS324: Large Language ModelsStanford大模型原理与应用
LLM UniversityCohere免费,Embedding 到 RAG
Hugging Face NLP CourseHugging Face开源工具实践
Full Stack LLM BootcampFull Stack Deep Learning工程化部署

进阶与研究

课程平台特点
CS229: Machine LearningStanford数学基础扎实
CS231n: CNN for Visual RecognitionStanford计算机视觉
ECE598: Topics in LLMsUIUC前沿研究主题
RLHF 系列课程多平台对齐技术深入

中文资源

资源类型特点
李宏毅机器学习视频中文讲解清晰,更新及时
动手学深度学习书籍+代码李沐,PyTorch 实践
AI 大模型全栈工程师课程实战导向
ChatGPT 提示工程课程OpenAI + DeepLearning.AI

活跃社区

技术社区

社区类型特点
Hugging Face平台+社区模型、数据集、Spaces
Reddit r/MachineLearning论坛论文讨论、新闻
Reddit r/LocalLLaMA论坛本地部署、开源模型
LessWrong博客+论坛AI 安全、对齐研究
AI Alignment Forum论坛对齐技术深度讨论

中文社区

社区类型特点
机器之心媒体中文 AI 新闻和论文解读
PaperWeekly媒体论文推荐和解读
知乎 AI 话题问答讨论活跃
Hugging Face 中文社区社区模型分享和讨论
魔搭社区平台阿里模型平台

Discord / Slack

服务器主题
Hugging Face开源模型、Transformers
LangChain应用开发
EleutherAI开源研究
LAION多模态、扩散模型
MLOps Community工程化部署

知识追踪工具

论文追踪

工具功能
arXiv Sanity Preserver个性化论文推荐
Research Rabbit论文关系图谱
Zotero文献管理
Readwise阅读高亮和回顾

新闻与动态

来源类型频率
Import AI邮件通讯每周
The Batch邮件通讯每周 (DeepLearning.AI)
TLDR AI邮件通讯每日
AI Weekly邮件通讯每周
One Useful Thing博客Ethan Mollick

播客

播客主题语言
Lex Fridman Podcast深度访谈英文
Machine Learning Street Talk技术讨论英文
The TWIML AI Podcast行业应用英文
AI 局内人中文 AI 讨论中文

推荐学习路径

路径一:应用开发者(3-6 个月)

第 1-2 月: 基础
├── Fast.ai 或 Andrew Ng ML 课程
└── Python + PyTorch 基础

第 3-4 月: 大模型基础
├── Hugging Face NLP Course
├── 实践: 用 Transformers 加载和微调模型
└── 学习 [[prompt-engineering]] 和 [[function-calling]]

第 5-6 月: 应用开发
├── LangChain / LlamaIndex 项目
├── 构建 RAG 应用
└── 部署到生产环境

路径二:研究者(6-12 个月)

第 1-3 月: 基础理论
├── CS229 + CS224N
├── 精读 Attention Is All You Need、GPT-3
└── 复现经典模型

第 4-6 月: 专精方向
├── 选择方向: 对齐 / 多模态 / 推理 / 效率
└── 深入阅读该方向论文

第 7-12 月: 研究实践
├── 参与开源项目
├── 复现最新论文
└── 撰写技术博客或论文

路径三:AI 产品经理/决策者(1-3 个月)

第 1 月: 技术理解
├── The Batch 通讯
├── ChatGPT 提示工程课程
└── 动手体验主流模型

第 2 月: 应用场景
├── 研究行业案例
├── 理解 [[ai-agents]] 和 [[retrieval-augmented-generation]]
└── 评估内部应用机会

第 3 月: 战略思考
├── 关注 [[ai-trends-2025]] 和 [[market-landscape-shifts]]
└── 制定 AI 落地路线图

推荐书单

入门

  • 《动手学深度学习》 — 李沐,理论与实践并重
  • 《Python机器学习》 — Sebastian Raschka

进阶

  • 《深度学习》 — Goodfellow et al.(花书)
  • 《自然语言处理入门》 — 宗成庆

大模型专项

  • 《Build a Large Language Model (from Scratch)》 — Sebastian Raschka
  • 《Hands-On Large Language Models》 — Jay Alammar

最后更新:2025-04-28 | 学习资源持续更新,建议订阅邮件通讯保持同步。

AI Knowledge Base — 持续积累