Appearance
AI 论文与学术资源
论文是 AI 领域进步的原点。本页汇总各个方向的经典论文、学术资源和研究工具,帮助你快速定位核心知识。
核心论文导航
基础架构
| 论文 | 作者 | 年份 | 贡献 | 链接 |
|---|---|---|---|---|
| Attention Is All You Need | Vaswani et al. (Google) | 2017 | Transformer 架构 | arXiv |
| BERT | Devlin et al. (Google) | 2018 | 双向预训练 | arXiv |
| GPT-3 | Brown et al. (OpenAI) | 2020 | 大规模语言模型 | arXiv |
| LLaMA | Touvron et al. (Meta) | 2023 | 开源大模型 | arXiv |
| Chinchilla | Hoffmann et al. (DeepMind) | 2022 | Scaling Laws 优化 | arXiv |
对齐与训练
| 论文 | 作者 | 年份 | 贡献 | 链接 |
|---|---|---|---|---|
| InstructGPT / RLHF | Ouyang et al. (OpenAI) | 2022 | 人类反馈强化学习 | arXiv |
| Constitutional AI | Bai et al. (Anthropic) | 2022 | AI 反馈对齐 | arXiv |
| DPO | Rafailov et al. | 2023 | 直接偏好优化 | arXiv |
| LoRA | Hu et al. (Microsoft) | 2021 | 低秉适应 | arXiv |
| QLoRA | Dettmers et al. | 2023 | 量化 LoRA | arXiv |
多模态
| 论文 | 作者 | 年份 | 贡献 | 链接 |
|---|---|---|---|---|
| CLIP | Radford et al. (OpenAI) | 2021 | 视觉-语言对齐 | arXiv |
| LLaVA | Liu et al. | 2023 | 大模型视觉对话 | arXiv |
| GPT-4V | OpenAI | 2023 | 多模态理解 | Tech Report |
| Sora | OpenAI | 2024 | 视频生成 | Tech Report |
| Stable Diffusion | Rombach et al. | 2022 | 开源图像生成 | arXiv |
推理与部署
| 论文 | 作者 | 年份 | 贡献 | 链接 |
|---|---|---|---|---|
| PagedAttention / vLLM | Kwon et al. (Berkeley) | 2023 | 高吞吐推理 | arXiv |
| FlashAttention | Dao et al. (Stanford) | 2022 | IO-aware 注意力 | arXiv |
| Speculative Decoding | Leviathan et al. (Google) | 2022 | 推测解码加速 | arXiv |
| AWQ | Lin et al. | 2023 | 激活值感知量化 | arXiv |
| TensorRT-LLM | NVIDIA | 2023 | GPU 推理优化 | Docs |
Agent 与工具使用
| 论文 | 作者 | 年份 | 贡献 | 链接 |
|---|---|---|---|---|
| ReAct | Yao et al. | 2022 | 推理+行动结合 | arXiv |
| Toolformer | Schick et al. (Meta) | 2023 | 工具学习 | arXiv |
| Function Calling | OpenAI | 2023 | 结构化工具调用 | Docs |
| RAG | Lewis et al. (Meta) | 2020 | 检索增强生成 | arXiv |
| DSPy | Khattab et al. (Stanford) | 2023 | 声明式 LLM 编程 | arXiv |
学术资源平台
论文检索
| 平台 | 特点 | 链接 |
|---|---|---|
| arXiv | 预印本论文主流平台 | arxiv.org |
| Google Scholar | 学术搜索引擎 | scholar.google.com |
| Semantic Scholar | AI 驱动的学术搜索 | semanticscholar.org |
| Papers With Code | 论文 + 代码 | paperswithcode.com |
| Connected Papers | 论文关系图谱 | connectedpapers.com |
论文阅读工具
| 工具 | 功能 | 链接 |
|---|---|---|
| Elicit | AI 辅助文献检索 | elicit.org |
| Consensus | 科学结论搜索 | consensus.app |
| SciSpace | 论文解读与问答 | typeset.io |
| ChatPDF | PDF 论文对话 | chatpdf.com |
顶会与活动
| 会议 | 时间 | 特点 | 链接 |
|---|---|---|---|
| NeurIPS | 12 月 | 机器学习顶会 | neurips.cc |
| ICML | 7 月 | 机器学习顶会 | icml.cc |
| ICLR | 5 月 | 表征学习顶会 | iclr.cc |
| ACL | 7-8 月 | NLP 顶会 | aclweb.org |
| CVPR | 6 月 | 计算视觉顶会 | cvpr.thecvf.com |
| AAAI | 2 月 | AI 综合顶会 | aaai.org |
研究机构与团队
顶级研究机构
| 机构 | 位置 | 代表工作 | 链接 |
|---|---|---|---|
| OpenAI | 美国 | GPT 系列 | openai.com/research |
| Google DeepMind | 英国/美国 | Gemini、AlphaFold | deepmind.google |
| Anthropic | 美国 | Claude、Constitutional AI | anthropic.com/research |
| Meta AI | 美国 | Llama、PyTorch | ai.meta.com |
| Mila | 加拿大 | 深度学习理论 | mila.quebec |
| Stanford HAI | 美国 | AI 政策与影响 | hai.stanford.edu |
| Berkeley AI Research | 美国 | vLLM、安全对齐 | bair.berkeley.edu |
论文管理工具
| 工具 | 功能 | 推荐场景 |
|---|---|---|
| Zotero | 文献管理 | 长期研究项目 |
| Mendeley | 文献管理 + 协作 | 团队研究 |
| Notion | 知识库 + 文献笔记 | 个人知识管理 |
| Obsidian | 本地知识库 | 私密性要求高 |
相关页面
- AI 学习资源导航 — AI 学习资源导航
- 模型仓库导航 — 模型仓库导航
- AI 数据集资源大全 — AI 数据集资源
- Transformer Architecture — Transformer 架构概念
- RLHF — RLHF 概念
- Retrieval Augmented Generation — RAG 概念
参考来源
- arXiv.org 论文库
- Papers With Code 网站
- 各会议官方网站
- 研究机构官方博客