跟着李沐逐字精读论文，这个开源项目让33000人直呼“救了我“。

yfj-unicorn

315人浏览 · 2026-05-21 20:44:08

yfj-unicorn · 2026-05-21 20:44:08 发布

摘要：李沐开源了一个深度学习论文精读项目，配套 B 站视频，逐段讲解 AlexNet、Transformer、BERT、GPT 等经典与前沿论文。不只讲内容，还讲读论文方法和写作技巧。33,000+ Stars，是 AI 学习者公认的高质量资源。

你有没有这种体验：

打开一篇 BERT 的论文，第一页还行，第二页开始有点懵，第三页直接开始刷手机。

不是不努力，是真的不知道从哪里下手。

我记得很清楚，大四毕业的时候，导师说"多看论文"，但从来没人告诉我怎么看。每次硬啃下来，感觉只是字面意思看懂了，但作者为什么这么设计、这个方法好在哪里、后来有没有人改进——脑子里一片空白。

直到我刷到李沐在 B 站开的「论文精读」系列，才第一次感受到：原来论文可以这样读。

李沐是谁？

如果你在深度学习圈待过，基本绕不开这个名字。

李沐（Mu Li），AWS 资深科学家，MXNet 深度学习框架的主要贡献者之一。他在 B 站开过《动手学深度学习》直播课，弹幕里常年飘着"沐神"两个字。

但他更让我佩服的，是他在有正职工作的情况下，深夜抽出碎片时间，一篇一篇录制论文精读视频——每篇约 5 小时，剪辑、上传全自己搞定。

2021 年 10 月，他把这个系列整理成开源项目放上 GitHub：

github.com/mli/paper-reading

截至今天，这个项目已经有 33,000+ Stars，2,800+ Fork，是深度学习学习者里真正的口碑项目。

这个项目解决了什么问题？

说白了，就两个字：读不懂。

学术论文有它自己的"语言习惯"：大量假设读者已知的背景知识、高度压缩的表达方式、有时候连作者自己都不一定讲清楚的细节。

普通学习者拿到一篇 Transformer 的论文，光是第一段的 encoder-decoder 结构就可能卡住。然后去搜博客，搜到的是别人的二次转述，理解又打折扣。

李沐这个项目的价值在于：他替你完成了「专家第一遍精读」的过程，并且把他脑子里的想法全部说出来。

他不只是讲论文写了什么，他会说：

"这句话的意思是……作者没有直接说，但你要理解背景是……"
"这里其实有个问题，后来 XXX 的工作证明这个假设是有瑕疵的"
"这个图画得不好，我来重画一下帮你理解"

这种感觉，就像有个大佬坐在你旁边陪你读论文。

他是怎么读论文的？

这也是项目里含金量很高的一部分——李沐总结了一套「三遍法」：

第一遍（10-15 分钟）：只看标题、摘要、结论，浏览一下图表。目标是判断这篇文章值不值得继续读。大量论文止步于此，这很正常。

第二遍：快速通读全文，了解每个部分在干什么，但不需要理解所有细节。重点圈出没看懂的参考文献——如果文章太难，先去读它引用的经典。

第三遍：带着批判性思维读。作者解决了什么问题？用了什么方法？如果是我，会怎么做？有没有可以改进的地方？

这三遍的本质是：先建立全局视角，再深入局部，最后主动质疑。

很多人一上来就死磕第三遍，读了两小时还没过第一页，最后放弃。李沐的方法给了一个「可执行的论文阅读 SOP」，对初学者非常友好。

覆盖了哪些论文？

项目规划精读 67 篇论文，目前已录制完成 32 篇，基本涵盖了深度学习近十年的核心脉络：

CV 方向

AlexNet（2012）——深度学习浪潮的奠基作，连李沐自己都说"9年后重读，依然有收获"
ResNet（2015）——残差连接，几乎所有深度模型都有它的影子
ViT、Swin Transformer——Transformer 跨界杀入 CV 的两个里程碑
MAE——Facebook 出的"CV 版 BERT"，看完你会明白为什么自监督学习这么火

NLP 方向

Transformer 原作（2017）——"Attention Is All You Need"，现代 AI 的基础砖块
BERT、GPT/GPT-2/GPT-3——从"语言理解"到"语言生成"的完整演进
Llama 3.1（2024）——Meta 最强开源模型，是的，最新的也有

多模态

CLIP——OpenAI 的工作，图片分类从此不用人工标注，读完会对多模态有直觉级的理解

代码生成

OpenAI Codex、AlphaCode——现在这么多 AI 编程工具，根就在这里

选题逻辑也很清晰：10 年内有影响力的必读文章，优先选之前直播课没讲过的。不求全，求精，求有代差的学习价值。

我最喜欢的细节

除了论文内容本身，李沐读论文时会顺带讲怎么写论文。

比如读 AlexNet 时，他会说："这里作者的写法有个问题，当时 CNN 并不是主流，应该先介绍主流方法再过渡到 CNN，这样读者更容易接受。"

这种视角，对于将来要写论文的研究生来说，是远比"这个模型有几层卷积"更值钱的东西。

还有一个细节：每篇视频的评论区都非常活跃。有人问问题，有人补充相关工作，有人说"听了三遍，每次都有新理解"。这种社区氛围是很多付费课程都做不到的。

适合谁看？

刚入门深度学习的研究生：别一上来就硬啃原文，先跟着李沐看视频，建立直觉再返回读原文
转行做 AI 的工程师：不想刷培训班，想直接理解技术本质，这个系列是最好的切入点之一
已经在做研究但基础薄弱的人：很多人能用 PyTorch 跑模型，但说不清楚为什么 ResNet 要用残差连接——这里有答案
想了解 AI 发展脉络的人：从 AlexNet 到 GPT-3 到 Llama 3.1，一条清晰的时间线就在这个项目里

怎么开始？

两个入口：

GitHub：github.com/mli/paper-reading在这里可以看到所有规划和已录制的论文列表，每篇都有 B 站视频链接。建议先看看论文列表，找一篇自己感兴趣的开始。

B 站：搜索「李沐」或「深度学习论文精读」，找到对应的播放列表。

我自己的建议是：从 Transformer 那期开始。

因为现在几乎所有主流模型——BERT、GPT、ViT、MAE、CLIP——都是 Transformer 的变体。这篇读懂了，后面的论文会顺很多。视频时长 1 小时出头，但值得你反复看。

深度学习发展太快，论文每天都在出，没有人能全部跟上。但有一些经典工作，是理解这个领域的"地基"——不管你现在做什么方向，早晚绕不过去。

李沐这个项目做的事情，就是帮你把这些地基打好。

33,000 人 Star 了它，我觉得这不是在收藏，是在说：这正是我需要的东西。

GitHub：github.com/mli/paper-reading

B 站：搜索「李沐论文精读」

去看看吧，从第一期开始。

我是顾北，关注我，获取更多好玩有趣的开源仓库！

谢谢你阅读我的文章~

我们下期再见！

PS：本文部分内容由AI辅助创作

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

Re：Linux系统篇（二十二）进程篇·七：环境变量的底层溯源、核心获取机制与安全应用

AtomGit开源社区

第7节课：LangGraph｜可视化流程图生成与调试技巧

AtomGit开源社区

Amphenol ICC DRPC21A005540线束解析

AtomGit开源社区

所有评论(0)

查看更多评论

yfj-unicorn

@m0_74837192

已为社区贡献51条内容

跟着李沐逐字精读论文，这个开源项目让33000人直呼“救了我“。

yfj-unicorn

李沐是谁？

这个项目解决了什么问题？

他是怎么读论文的？

覆盖了哪些论文？

我最喜欢的细节

适合谁看？

怎么开始？

所有评论(0)

温馨提示：您尚未绑定手机号

yfj-unicorn