Appearance
AI 学习资源导航
从入门到进阶的 AI 学习路径,涵盖经典论文、优质课程、活跃社区和知识追踪工具。
经典论文路线图
基础架构(必读)
| 论文 | 年份 | 贡献 | 重要性 |
|---|---|---|---|
| Attention Is All You Need | 2017 | 提出 Transformer 架构 | ⭐⭐⭐ 现代大模型基石 |
| BERT: Pre-training of Deep Bidirectional Transformers | 2018 | 双向编码预训练 | ⭐⭐⭐ NLP 范式转变 |
| Language Models are Few-Shot Learners (GPT-3) | 2020 | 证明大规模上下文学习能力 | ⭐⭐⭐ 涌现能力起点 |
| Training language models to follow instructions (InstructGPT) | 2022 | RLHF 对齐方法 | ⭐⭐⭐ ChatGPT 技术基础 |
扩展与效率
| 论文 | 年份 | 贡献 |
|---|---|---|
| Scaling Laws for Neural Language Models | 2020 | 规模定律系统研究 |
| Switch Transformers | 2021 | 大规模 MoE 实践 |
| LoRA: Low-Rank Adaptation | 2021 | 参数高效微调 |
| QLoRA | 2023 | 单卡微调大模型 |
| FlashAttention | 2022 | 内存高效 Attention |
推理与 Agent
| 论文 | 年份 | 贡献 |
|---|---|---|
| Chain-of-Thought Prompting | 2022 | 推理链提示 |
| Toolformer | 2023 | 模型自学工具使用 |
| ReAct | 2023 | 推理+行动结合 |
| Direct Preference Optimization (DPO) | 2023 | 无需奖励模型的对齐 |
| DeepSeek-R1 | 2025 | 纯 RL 推理模型 |
多模态
| 论文 | 年份 | 贡献 |
|---|---|---|
| CLIP | 2021 | 视觉-语言对齐 |
| LLaVA | 2023 | 视觉指令微调 |
| GPT-4V | 2023 | 多模态大模型 |
| Sora | 2024 | 视频生成 |
论文获取渠道
- arXiv: arxiv.org/list/cs.AI/recent — 最新预印本
- Papers With Code: paperswithcode.com — 论文+代码+基准
- Semantic Scholar: semanticscholar.org — 引用分析和推荐
- Connected Papers: connectedpapers.com — 论文关系图谱
在线课程
入门课程
| 课程 | 平台 | 讲师/机构 | 特点 |
|---|---|---|---|
| CS50's Introduction to AI with Python | edX | Harvard | 零基础友好,Python 实践 |
| Machine Learning Specialization | Coursera | Andrew Ng | 经典入门,系统全面 |
| Deep Learning Specialization | Coursera | Andrew Ng | 深度学习基础 |
| Fast.ai Practical Deep Learning | fast.ai | Jeremy Howard | 实战导向,自上而下 |
大模型专项
| 课程 | 平台 | 特点 |
|---|---|---|
| CS224N: NLP with Deep Learning | Stanford | Transformer、预训练、微调 |
| CS324: Large Language Models | Stanford | 大模型原理与应用 |
| LLM University | Cohere | 免费,Embedding 到 RAG |
| Hugging Face NLP Course | Hugging Face | 开源工具实践 |
| Full Stack LLM Bootcamp | Full Stack Deep Learning | 工程化部署 |
进阶与研究
| 课程 | 平台 | 特点 |
|---|---|---|
| CS229: Machine Learning | Stanford | 数学基础扎实 |
| CS231n: CNN for Visual Recognition | Stanford | 计算机视觉 |
| ECE598: Topics in LLMs | UIUC | 前沿研究主题 |
| RLHF 系列课程 | 多平台 | 对齐技术深入 |
中文资源
| 资源 | 类型 | 特点 |
|---|---|---|
| 李宏毅机器学习 | 视频 | 中文讲解清晰,更新及时 |
| 动手学深度学习 | 书籍+代码 | 李沐,PyTorch 实践 |
| AI 大模型全栈工程师 | 课程 | 实战导向 |
| ChatGPT 提示工程 | 课程 | OpenAI + DeepLearning.AI |
活跃社区
技术社区
| 社区 | 类型 | 特点 |
|---|---|---|
| Hugging Face | 平台+社区 | 模型、数据集、Spaces |
| Reddit r/MachineLearning | 论坛 | 论文讨论、新闻 |
| Reddit r/LocalLLaMA | 论坛 | 本地部署、开源模型 |
| LessWrong | 博客+论坛 | AI 安全、对齐研究 |
| AI Alignment Forum | 论坛 | 对齐技术深度讨论 |
中文社区
| 社区 | 类型 | 特点 |
|---|---|---|
| 机器之心 | 媒体 | 中文 AI 新闻和论文解读 |
| PaperWeekly | 媒体 | 论文推荐和解读 |
| 知乎 AI 话题 | 问答 | 讨论活跃 |
| Hugging Face 中文社区 | 社区 | 模型分享和讨论 |
| 魔搭社区 | 平台 | 阿里模型平台 |
Discord / Slack
| 服务器 | 主题 |
|---|---|
| Hugging Face | 开源模型、Transformers |
| LangChain | 应用开发 |
| EleutherAI | 开源研究 |
| LAION | 多模态、扩散模型 |
| MLOps Community | 工程化部署 |
知识追踪工具
论文追踪
| 工具 | 功能 |
|---|---|
| arXiv Sanity Preserver | 个性化论文推荐 |
| Research Rabbit | 论文关系图谱 |
| Zotero | 文献管理 |
| Readwise | 阅读高亮和回顾 |
新闻与动态
| 来源 | 类型 | 频率 |
|---|---|---|
| Import AI | 邮件通讯 | 每周 |
| The Batch | 邮件通讯 | 每周 (DeepLearning.AI) |
| TLDR AI | 邮件通讯 | 每日 |
| AI Weekly | 邮件通讯 | 每周 |
| One Useful Thing | 博客 | Ethan Mollick |
播客
| 播客 | 主题 | 语言 |
|---|---|---|
| Lex Fridman Podcast | 深度访谈 | 英文 |
| Machine Learning Street Talk | 技术讨论 | 英文 |
| The TWIML AI Podcast | 行业应用 | 英文 |
| AI 局内人 | 中文 AI 讨论 | 中文 |
推荐学习路径
路径一:应用开发者(3-6 个月)
第 1-2 月: 基础
├── Fast.ai 或 Andrew Ng ML 课程
└── Python + PyTorch 基础
第 3-4 月: 大模型基础
├── Hugging Face NLP Course
├── 实践: 用 Transformers 加载和微调模型
└── 学习 [[prompt-engineering]] 和 [[function-calling]]
第 5-6 月: 应用开发
├── LangChain / LlamaIndex 项目
├── 构建 RAG 应用
└── 部署到生产环境路径二:研究者(6-12 个月)
第 1-3 月: 基础理论
├── CS229 + CS224N
├── 精读 Attention Is All You Need、GPT-3
└── 复现经典模型
第 4-6 月: 专精方向
├── 选择方向: 对齐 / 多模态 / 推理 / 效率
└── 深入阅读该方向论文
第 7-12 月: 研究实践
├── 参与开源项目
├── 复现最新论文
└── 撰写技术博客或论文路径三:AI 产品经理/决策者(1-3 个月)
第 1 月: 技术理解
├── The Batch 通讯
├── ChatGPT 提示工程课程
└── 动手体验主流模型
第 2 月: 应用场景
├── 研究行业案例
├── 理解 [[ai-agents]] 和 [[retrieval-augmented-generation]]
└── 评估内部应用机会
第 3 月: 战略思考
├── 关注 [[ai-trends-2025]] 和 [[market-landscape-shifts]]
└── 制定 AI 落地路线图推荐书单
入门
- 《动手学深度学习》 — 李沐,理论与实践并重
- 《Python机器学习》 — Sebastian Raschka
进阶
- 《深度学习》 — Goodfellow et al.(花书)
- 《自然语言处理入门》 — 宗成庆
大模型专项
- 《Build a Large Language Model (from Scratch)》 — Sebastian Raschka
- 《Hands-On Large Language Models》 — Jay Alammar
最后更新:2025-04-28 | 学习资源持续更新,建议订阅邮件通讯保持同步。