在这里插入图片描述

🔥 8大模块 · 37篇论文/资源 · 3阶段递进 —— 一份写给工程师的AI Agent & RAG系统化学习指南


前言

AI Agent 和 RAG(检索增强生成)是2025-2026年最热门的AI工程方向。但网上的资料要么太学术,要么太浅尝辄止。我花了一周时间,从DeepSeek的深度对话中梳理出一条可执行的12周学习路线,覆盖从LLM基础到Agent架构、RAG工程、AI产品思维和商业化的全链路。

这篇文章不只是书单——每个模块都有明确的产出目标优先级标注,让你学完就能用。


📋 全局地图

AI Agent & RAG 学习计划
│
├── 🟢 第一阶段:基础夯实(W1-W4)
│   ├── 03-LLM基础:Transformer / Token / RLHF / DPO
│   └── 01-Agent架构:ReAct / Plan-then-Execute / Multi-Agent
│
├── 🟡 第二阶段:工程实战(W5-W8)
│   ├── 02-RAG:GraphRAG / HiRAG / 工程实践
│   └── 01-Agent:框架实操 / 评测体系
│
└── 🔴 第三阶段:产品与商业(W9-W12)
    ├── 04-AI Native:产品思维 / 推荐书籍
    ├── 05-商业化:定价策略 / 产品定位
    ├── 06-行业:ITSM / 迁移工具 / Agent平台
    └── 08-资源:信息源 / 知识图谱

🟢 第一阶段:基础夯实(第1-4周)

目标:建立LLM和Agent的核心认知,能看懂主流论文

W1-W2:LLM基础

学习内容 产出
W1 Transformer原理、Token机制、RLHF/DPO 笔记:LLM核心概念速查
W2 幻觉问题、模型评测 完成Andrew Ng课程

核心资源:

资源 说明
Attention Is All You Need (Vaswani et al., 2017) Transformer开山之作,必读
Illustrated Transformer (Jay Alammar) 可视化讲解,入门首选
RLHF / DPO 对齐 (Hugging Face Blog) RLHF vs DPO原理对比
Stanford CS224n: NLP with Deep Learning B站有全集,NLP入门必看
DeepLearning.AI - LangChain for LLM Application Development Andrew Ng出品

幻觉专题(面试高频):

论文 核心观点
A Comprehensive Survey of Hallucination in LLMs (2025) 幻觉问题全景综述
Survey and Analysis of Hallucinations in LLMs (Frontiers, 2025) Prompt层面缓解策略

模型评测:

平台 用途
LMSYS Chatbot Arena 众包盲评排行
Artificial Analysis API性能/价格/延迟对比

当前Top模型:GPT-4o / Claude 3.5 Sonnet / Gemini 2.0 / DeepSeek-V3 / Qwen


W3-W4:Agent架构与范式

学习内容 产出
W3 ReAct / Plan-then-Execute范式 笔记:Agent推理范式对比
W4 Multi-Agent架构 + Anthropic Agent设计 笔记:Agent架构选型指南
单Agent推理范式
# 论文 年份 核心观点 优先级
1 ReAct: Synergizing Reasoning and Acting (Yao et al.) 2022 Thought-Action-Observation循环 ⭐⭐⭐ 必读
2 Plan-then-Execute (Del Rosario et al.) 2025 Planner/Executor分离,先规划后执行 ⭐⭐⭐ 必读
3 Web Agents Should Adopt Plan-Then-Execute 2026 Web Agent场景P-t-E优于ReAct 80% ⭐⭐ 推荐
4 Reason-Plan-ReAct (RP-ReAct) 2025 融合推理+规划 ⭐⭐ 推荐

💡 费曼检验:能否用一句话讲清楚ReAct vs P-t-E的区别?
ReAct是"边想边做",P-t-E是"先想好再做"——前者灵活但易走偏,后者可控但需 upfront规划。

Multi-Agent架构
# 论文 核心观点 优先级
5 MPAC: Multi-Principal Agent Coordination 五层协调:Session/Intent/Operation/Conflict/Governance ⭐⭐ 推荐
6 COLLAB-LLM 角色分工 + 通信协议 + 冲突解决 ⭐⭐ 推荐
7 Federation of Agents (FoA) Versioned Capability Vectors实现跨域互操作 ⭐ 选读
Anthropic Agent设计理念
资源 说明
Building effective agents (Anthropic, 2024.12) Agent定义、Workflow vs自主Agent区分——业界标杆文章

这篇文章的含金量极高。Anthropic把Agent分为两类:Workflow Agent(流程编排,人定义路径)和Autonomous Agent(自主决策,AI定义路径)。选型前必读。


🟡 第二阶段:工程实战(第5-8周)

目标:跑通RAG和Agent的Demo,掌握评测体系

W5-W6:RAG检索增强生成

学习内容 产出
W5 GraphRAG / HiRAG / ParetoRAG前沿方案 笔记:RAG方案对比矩阵
W6 RAG工程实践(LangChain/LlamaIndex/RAGAS) 跑通一个RAG Demo
前沿RAG方案
# 论文 年份 核心观点 优先级
12 GraphRAG (Microsoft) 2024 LLM提取实体关系→社区检测→MapReduce全局摘要 ⭐⭐⭐ 必读
13 GeAR: Graph-enhanced Agent for RAG 2025 图增强Agent RAG ⭐⭐ 推荐
14 HiRAG: Hierarchical Knowledge RAG 2025 层次化知识索引 ⭐⭐ 推荐
15 ParetoRAG 2025 帕累托最优检索 ⭐ 选读
16 Zero-RAG 2025 零样本RAG,30% Wikipedia索引降22% ⭐ 选读
17 OG-RAG: Ontology-grounded RAG 2025 本体论接地RAG ⭐ 选读

💡 RAG演进路线:Naive RAG → Advanced RAG → Graph RAG → Agentic RAG。当前业界主流正在从Advanced RAG向Graph RAG和Agentic RAG迁移。

RAG工程实践
主题 内容
LangChain RAG教程 Naive RAG → Advanced RAG完整路径
LlamaIndex RAG教程 Ingestion → Indexing → Retrieval → Generation pipeline
RAGAS评测框架 Faithfulness / Answer Relevancy / Context Precision/Recall
Chunking策略 固定大小 vs 语义切分 vs 递归切分

W7-W8:Agent框架与评测

学习内容 产出
W7 LangChain / LangGraph / CrewAI / AutoGen实操 跑通一个Agent Demo
W8 Agent评测体系 笔记:评测框架选型
Agent开发框架选型
框架 定位 特点 适合场景
LangChain LLM应用开发框架 生态最全+插件最多 通用LLM应用
LangGraph 有状态Agent框架 StateGraph+Checkpoint 复杂状态机Agent
LlamaIndex 数据索引框架 RAG能力最强 知识密集型应用
CrewAI 多Agent协作框架 角色化协作 多角色任务
AutoGen (Microsoft) 多Agent对话框架 对话驱动+代码执行 研究/实验

🎯 选型建议:LangChain通用入门 → LlamaIndex做RAG → LangGraph做复杂Agent

Agent评测
# 论文 核心观点
8 Evaluation and Benchmarking of LLM Agents Agent评测全景综述
9 Agent-as-a-Judge (2025) 用Agent评测Agent,超越LLM-as-a-Judge
10 Beyond Accuracy (2025) 企业级Agent多维评测
11 Holistic Agent Leaderboard (2025) 9大Benchmark,21,730个Agent rollout

🛠 工具链:LangSmith(trace)+ Braintrust(评测)+ RAGAS(RAG评测)


🔴 第三阶段:产品与商业(第9-12周)

目标:从技术到产品,理解AI的商业闭环

W9:AI Native产品思维

资源 核心观点
AI Native产品定义 (2025) AI Native ≠ AI Wrapper,从0开始设计而非套壳
Claude Code = AI-Native开发范例 AI不是辅助,是核心交互方式
AI Native产品10大原则 (InfoQ) PRD也需要AI-Native化

推荐书籍:

书名 作者 核心价值
The Design of Everyday AI Things Don Norman风格 AI时代交互设计
Co-Intelligence: Living and Working with AI Ethan Mollick AI协作生活工作指南
The Coming Wave Mustafa Suleyman DeepMind联创谈AI未来

W10:AI商业化与定价

资源 核心观点
API计费/Tiered/按量 (2025) Token计费是AI商业化起点
AI定价策略综述 (36氪, 2025) 中国市场定价实践
AI商业化定价 (Stripe, 2025) Stripe视角的AI支付
BGV AI Advisory: Pricing for Agentic AI Agent AI定价策略

产品定位参考:

资源 核心价值
Obviously Awesome (April Dunford) B2B定位方法论
Monetizing Innovation 定价驱动创新
a16z AI Canon AI投资图谱+LLM技术栈

W11:行业应用

ITSM / IT服务管理
厂商 产品 AI能力
ServiceNow AI Experience AI Agent驱动,Gartner MQ领导者
Salesforce Agentforce IT Service 2025.09发布,Slack深度集成
Zendesk AI Agent 自动化客服
BMC 25.2/25.3 AI Agent进入ITSM+ITOM
迁移工具
厂商 产品
AWS Application Migration Service + Migration Hub
Azure Migrate + Arc
Google Migrate for Compute Engine + Anthos
Agent开发平台
平台 定位
Coze 字节旗下,低代码Agent
Dify 开源LLMOps平台
n8n Workflow自动化+AI节点
扣子AI IM驱动AI Agent

W12:信息源与知识体系

核心信息源
信息源 频率 链接 说明
Lilian Weng博客 不定期 lilianweng.github.io OpenAI研究负责人,质量极高
Anthropic Research Blog 不定期 anthropic.com/research Agent/对齐/安全
The Batch (Andrew Ng) 每周 deeplearning.ai/the-batch AI趋势周报
a16z AI Canon 不定期 a16z.com/ai-canon AI投资全景
LangChain Blog 不定期 blog.langchain.dev Agent/RAG工程
LlamaIndex Blog 不定期 llamaindex.ai/blog RAG前沿
中文资源
资源 说明
AIGC研究院19赛道全景 (2025) 50+公司覆盖
AI Agent产业链全景图 (ProcessOn) 产业链可视化
36氪AI频道 商业化/定价
2025全球AI产品榜 产品排行
知识图谱速查
领域 核心概念
LLM Transformer / Token / Pre-training / SFT / RLHF / DPO / Temperature / Top-p
Agent ReAct / Plan-then-Execute / Multi-Agent / Function Calling / MCP / A2A
RAG 向量检索 / 稀疏检索 / 混合检索 / Chunking / HyDE / RAPTOR / GraphRAG / Agentic RAG / RAGAS
AI产品 AI Native vs AI Wrapper / Prompt Engineering / AI定价 / Agent计费

📝 论文下载清单(按优先级)

⭐⭐⭐ 必读(先下这4篇)

⭐⭐ 推荐

  • Web Agents Should Adopt Plan-Then-Execute (2026)
  • RP-ReAct (2025)
  • MPAC: Multi-Principal Agent Coordination (2026)
  • COLLAB-LLM (2026)
  • GeAR: Graph-enhanced Agent for RAG (2025)
  • HiRAG: Hierarchical Knowledge RAG (2025)
  • Agent-as-a-Judge (2025)
  • Beyond Accuracy (2025)
  • A Comprehensive Survey of Hallucination in LLMs (2025)

⭐ 选读

  • Federation of Agents (FoA, 2025)
  • ParetoRAG (2025)
  • Zero-RAG (2025)
  • OG-RAG (2025)
  • Holistic Agent Leaderboard (2025)

基础论文


🎯 学习方法

  1. 论文阅读:先读Abstract + Conclusion,再决定是否精读全文
  2. 框架实操:每个框架至少跑一个官方Demo,再改造成自己的场景
  3. 笔记输出:每学完一个模块,写一篇500字总结
  4. 费曼检验:能否用一句话讲清楚核心概念?
  5. 节奏控制:每周10小时,不贪多,求扎实

总结

这份学习路线的核心逻辑是三层递进

  1. 基础层(W1-4):搞懂LLM怎么工作、Agent怎么推理
  2. 工程层(W5-8):能跑RAG和Agent的Demo,懂评测
  3. 产品层(W9-12):理解AI产品怎么设计、怎么赚钱

12周只是起点,真正的深度需要持续实践。但有了这份路线,你至少不会在信息海洋里迷路。

如果觉得有用,欢迎点赞收藏,也欢迎在评论区交流你的学习进度和心得 👇


路易乔布斯 © 2026 | 本文学习计划源自## 📚 相关文章推荐

以下是近期发布的《系统学AI》相关文章,推荐阅读:

【系统学AI】0 一文搞定AI Agent与RAG:从入门到工程实战的完整学习路线

1.【系统学AI】01 Transformer原理全解:从Self-Attention到GPT的架构进化
2. 【系统学AI】02 token机制全解:LLM如何‘读懂‘人类语言
3. 【系统学AI】03 LLM训练全流程:预训练→SFT→对齐五条路线
未完待续

想要系统学习的朋友,快收藏起来慢慢看吧,更多更新请关注账号~

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐