AI 学习资源导航

从入门到进阶的 AI 学习路径，涵盖经典论文、优质课程、活跃社区和知识追踪工具。

经典论文路线图

基础架构（必读）

论文	年份	贡献	重要性
Attention Is All You Need	2017	提出 Transformer 架构	⭐⭐⭐ 现代大模型基石
BERT: Pre-training of Deep Bidirectional Transformers	2018	双向编码预训练	⭐⭐⭐ NLP 范式转变
Language Models are Few-Shot Learners (GPT-3)	2020	证明大规模上下文学习能力	⭐⭐⭐ 涌现能力起点
Training language models to follow instructions (InstructGPT)	2022	RLHF 对齐方法	⭐⭐⭐ ChatGPT 技术基础

扩展与效率

论文	年份	贡献
Scaling Laws for Neural Language Models	2020	规模定律系统研究
Switch Transformers	2021	大规模 MoE 实践
LoRA: Low-Rank Adaptation	2021	参数高效微调
QLoRA	2023	单卡微调大模型
FlashAttention	2022	内存高效 Attention

推理与 Agent

论文	年份	贡献
Chain-of-Thought Prompting	2022	推理链提示
Toolformer	2023	模型自学工具使用
ReAct	2023	推理+行动结合
Direct Preference Optimization (DPO)	2023	无需奖励模型的对齐
DeepSeek-R1	2025	纯 RL 推理模型

多模态

论文	年份	贡献
CLIP	2021	视觉-语言对齐
LLaVA	2023	视觉指令微调
GPT-4V	2023	多模态大模型
Sora	2024	视频生成

论文获取渠道

arXiv: arxiv.org/list/cs.AI/recent — 最新预印本
Papers With Code: paperswithcode.com — 论文+代码+基准
Semantic Scholar: semanticscholar.org — 引用分析和推荐
Connected Papers: connectedpapers.com — 论文关系图谱

在线课程

入门课程

课程	平台	讲师/机构	特点
CS50's Introduction to AI with Python	edX	Harvard	零基础友好，Python 实践
Machine Learning Specialization	Coursera	Andrew Ng	经典入门，系统全面
Deep Learning Specialization	Coursera	Andrew Ng	深度学习基础
Fast.ai Practical Deep Learning	fast.ai	Jeremy Howard	实战导向，自上而下

大模型专项

课程	平台	特点
CS224N: NLP with Deep Learning	Stanford	Transformer、预训练、微调
CS324: Large Language Models	Stanford	大模型原理与应用
LLM University	Cohere	免费，Embedding 到 RAG
Hugging Face NLP Course	Hugging Face	开源工具实践
Full Stack LLM Bootcamp	Full Stack Deep Learning	工程化部署

进阶与研究

课程	平台	特点
CS229: Machine Learning	Stanford	数学基础扎实
CS231n: CNN for Visual Recognition	Stanford	计算机视觉
ECE598: Topics in LLMs	UIUC	前沿研究主题
RLHF 系列课程	多平台	对齐技术深入

中文资源

资源	类型	特点
李宏毅机器学习	视频	中文讲解清晰，更新及时
动手学深度学习	书籍+代码	李沐，PyTorch 实践
AI 大模型全栈工程师	课程	实战导向
ChatGPT 提示工程	课程	OpenAI + DeepLearning.AI

活跃社区

技术社区

社区	类型	特点
Hugging Face	平台+社区	模型、数据集、Spaces
Reddit r/MachineLearning	论坛	论文讨论、新闻
Reddit r/LocalLLaMA	论坛	本地部署、开源模型
LessWrong	博客+论坛	AI 安全、对齐研究
AI Alignment Forum	论坛	对齐技术深度讨论

中文社区

社区	类型	特点
机器之心	媒体	中文 AI 新闻和论文解读
PaperWeekly	媒体	论文推荐和解读
知乎 AI 话题	问答	讨论活跃
Hugging Face 中文社区	社区	模型分享和讨论
魔搭社区	平台	阿里模型平台

Discord / Slack

服务器	主题
Hugging Face	开源模型、Transformers
LangChain	应用开发
EleutherAI	开源研究
LAION	多模态、扩散模型
MLOps Community	工程化部署

知识追踪工具

论文追踪

工具	功能
arXiv Sanity Preserver	个性化论文推荐
Research Rabbit	论文关系图谱
Zotero	文献管理
Readwise	阅读高亮和回顾

新闻与动态

来源	类型	频率
Import AI	邮件通讯	每周
The Batch	邮件通讯	每周 (DeepLearning.AI)
TLDR AI	邮件通讯	每日
AI Weekly	邮件通讯	每周
One Useful Thing	博客	Ethan Mollick

播客

播客	主题	语言
Lex Fridman Podcast	深度访谈	英文
Machine Learning Street Talk	技术讨论	英文
The TWIML AI Podcast	行业应用	英文
AI 局内人	中文 AI 讨论	中文

推荐学习路径

路径一：应用开发者（3-6 个月）

第 1-2 月: 基础
├── Fast.ai 或 Andrew Ng ML 课程
└── Python + PyTorch 基础

第 3-4 月: 大模型基础
├── Hugging Face NLP Course
├── 实践: 用 Transformers 加载和微调模型
└── 学习 [[prompt-engineering]] 和 [[function-calling]]

第 5-6 月: 应用开发
├── LangChain / LlamaIndex 项目
├── 构建 RAG 应用
└── 部署到生产环境

路径二：研究者（6-12 个月）

第 1-3 月: 基础理论
├── CS229 + CS224N
├── 精读 Attention Is All You Need、GPT-3
└── 复现经典模型

第 4-6 月: 专精方向
├── 选择方向: 对齐 / 多模态 / 推理 / 效率
└── 深入阅读该方向论文

第 7-12 月: 研究实践
├── 参与开源项目
├── 复现最新论文
└── 撰写技术博客或论文

路径三：AI 产品经理/决策者（1-3 个月）

第 1 月: 技术理解
├── The Batch 通讯
├── ChatGPT 提示工程课程
└── 动手体验主流模型

第 2 月: 应用场景
├── 研究行业案例
├── 理解 [[ai-agents]] 和 [[retrieval-augmented-generation]]
└── 评估内部应用机会

第 3 月: 战略思考
├── 关注 [[ai-trends-2025]] 和 [[market-landscape-shifts]]
└── 制定 AI 落地路线图

AI 学习资源导航 ​

经典论文路线图 ​

基础架构（必读） ​

扩展与效率 ​

推理与 Agent ​

多模态 ​

论文获取渠道 ​

在线课程 ​

入门课程 ​

大模型专项 ​

进阶与研究 ​

中文资源 ​

活跃社区 ​

技术社区 ​

中文社区 ​

Discord / Slack ​

知识追踪工具 ​

论文追踪 ​

新闻与动态 ​

播客 ​

推荐学习路径 ​

路径一：应用开发者（3-6 个月） ​

路径二：研究者（6-12 个月） ​

路径三：AI 产品经理/决策者（1-3 个月） ​

推荐书单 ​

入门 ​

进阶 ​

大模型专项 ​

AI 学习资源导航

经典论文路线图

基础架构（必读）

扩展与效率

推理与 Agent

多模态

论文获取渠道

在线课程

入门课程

大模型专项

进阶与研究

中文资源

活跃社区

技术社区

中文社区

Discord / Slack

知识追踪工具

论文追踪

新闻与动态

播客

推荐学习路径

路径一：应用开发者（3-6 个月）

路径二：研究者（6-12 个月）

路径三：AI 产品经理/决策者（1-3 个月）

推荐书单

入门

进阶

大模型专项