学了大半年大模型应用开发，整理了这份路线图

Python秒杀

368人浏览 · 2026-03-26 10:16:17

Python秒杀 · 2026-03-26 10:16:17 发布

最近花了不少时间学 LLM 应用开发，从调 API 到搭 RAG、做 Agent，整个过程踩了不少坑，也理出了一条自己觉得比较顺的学习路线：

Transformer 基础 → 先搞懂模型到底在做什么
LangChain / LangGraph 框架 → 把零散的 API 调用编排成应用
RAG 检索增强 → 让模型能查知识库、答专业问题
Agent 智能体 → 让模型学会使用工具、自主决策
工程化实践 → 把 Demo 变成能上线的生产系统

学习过程中做了大量笔记，打算整理成系列发出来。这篇是总路线图，先把整个知识体系的脉络理一遍。

5 个系列

① Transformer 基础——理解模型到底在做什么

起点。不了解 Transformer，后面很多东西理解起来会很吃力。这部分笔记覆盖从输入到输出的完整数据流，6 个主题：

Tokenizer 分词器：文字怎么被切分为 Token
Embedding 向量：Token 怎么变成模型能理解的数字，余弦相似度怎么算
Attention 机制：模型读到第 500 个词时，怎么还能"记住"第 3 个词——QKV 到底在算什么
Transformer 概述：GPT 和 BERT 都是 Transformer，为什么一个擅长生成、一个擅长理解
Prompt Engineering ：同一个模型，为什么有人用得好有人用得差——差在 Prompt 上
API 调用实践：OpenAI、Claude、通义千问等大模型 API 怎么接、怎么调

这部分搞清楚之后，既理解了模型内部在做什么，也能实际上手调 API、写好 Prompt——后面学框架和搭应用就有底了。

② LangChain + LangGraph 框架——从零散调用到系统化应用

会调 API 之后，需要多轮对话、文档检索、工具调用时，手写全部逻辑很痛苦。LangChain 是目前最主流的 LLM 应用开发框架，LangGraph 是它的工作流编排扩展，两者放在一起整理，12 个主题：

LangChain 部分：

概述：为什么不直接调 API 而要用框架
Model I/O ：模型接口、Prompt 模板和输出解析——跟模型对话的标准姿势
Chain 链：LCEL 表达式语言，用管道操作符把多个步骤串起来
Memory 记忆：让对话机器人记住上下文，不会每轮都"失忆"
Retrieval 检索：文档加载、分割、向量存储——RAG 系统在 LangChain 里怎么搭
Agent 智能体：ReAct 模式，让模型学会调用外部工具

LangGraph 部分：

核心概念：StateGraph、Node、Edge——用状态图描述工作流
状态管理与流程控制：条件分支、循环、并行执行——比线性 Chain 灵活得多
持久化与检查点：长任务怎么"断点续传"
Human-in-the-Loop ：敏感操作让人确认，Agent 不能全自动
多 Agent 协作：Supervisor 和 Swarm 两种模式，让多个 Agent 分工合作
实战应用：ReAct、Plan-Execute、Reflection 等 5 种工作流模式实现

这部分学完，基本就能自己搭对话机器人、RAG 问答、简单的 Agent 助手了。

③ RAG 检索增强——让模型能查知识库、答专业问题

大模型什么都知道一点，但专业领域经常答错。RAG 是目前企业落地最常见的方案——给模型"外挂"一个知识库，先查再答。这部分笔记比较多，10 个主题：

概述：RAG 是什么，为什么不直接微调——比微调更轻量、更灵活的知识扩展方案
数据处理：文档怎么切块——切太碎找不到，切太大塞不下
向量化：Embedding 模型怎么选，向量数据库怎么用
查询优化：用户的问题不好搜，怎么帮他重新问——Multi Query、RAG-Fusion、HyDE
检索策略：语义检索 + 关键词检索怎么配合——混合检索和父文档检索
重排序：检索到了 100 条，怎么挑出最相关的 5 条
评估与优化：用 RAGAS 框架量化检索质量，发现和抑制模型幻觉
GraphRAG ：当向量检索搞不定复杂关系推理，知识图谱 + RAG 的融合方案
AgenticRAG ：让 Agent 自己决定要不要检索——RAG 的下一步
实战应用：从零搭建企业知识库问答系统的完整流程

走完这条线，从数据处理到检索优化到质量评估的完整链路就通了。

④ Agent 智能体——让模型学会使用工具、自主决策

现在最热的方向。模型不再只是"问一句答一句"，而是能自己规划任务、调用工具、甚至多个 Agent 协作。8 个主题：

概述：从聊天机器人到自主决策的智能体——Agent 的核心认知架构
核心组件：一个能干活的 Agent 需要五个模块——感知、规划、记忆、工具、执行器
设计模式：不同任务该让 Agent 怎么思考——ReAct、Plan-and-Solve、Reflection、Tree of Thoughts
MCP 协议：Anthropic 推出的工具标准化协议——让 Agent 的工具调用有了统一接口
A2A 协议：Google 的 Agent 间通信标准——Agent 之间怎么对话和协作
多智能体系统：Supervisor 和 Swarm 两种协作模式——复杂任务怎么分给多个 Agent
安全与治理：Prompt 注入防护、权限控制——让 Agent 在可控范围内自主行动
实战应用：搭建一个能用工具、会反思的智能助手

这部分变化很快，笔记里会尽量标注当时的技术版本。

⑤ 工程化实践——从 Demo 到生产的最后一公里

原理懂了、Demo 跑通了，上线前还差不少东西。这部分是踩坑最多的地方，5 个主题：

LangSmith 追踪与评估：LLM 应用的链路追踪怎么做，调用链出了问题怎么定位
Agent 评估体系：怎么衡量一个智能体的好坏——AgentBench 等评估框架
Tracing 链路追踪：分布式追踪和可观测性——线上问题的排查利器
Prompt 注入防护：LLM 应用的安全第一课——攻击手段和防护策略
生产部署实践：从 Demo 到生产的最后一公里——部署、监控、成本优化

这些在网上比较零散，我尽量整理成系统的笔记。

完整笔记

完整的笔记我放在了飞书知识库里，方便按主题翻阅：

知识库目录结构：

📚 大模型应用开发学习笔记
 ├── 📖 大模型应用开发学习路线图
 ├── 📂 阶段一：Transformer 基础
 │   ├── 1. 概述（快速入门 / 知识详解 / 知识导图）
 │   ├── 2. Attention 机制
 │   ├── 3. Embedding 向量
 │   ├── 4. Tokenizer 分词器
 │   ├── 5. Prompt Engineering
 │   └── 6. API 调用实践
 ├── 📂 阶段二：LangChain + LangGraph 框架
 │   ├── LangChain（概述 / Model I/O / Chain / Memory / Retrieval / Agent / LangSmith / 实战）
 │   └── LangGraph（核心概念 / 状态管理 / 流程控制 / 持久化 / 人机协作 / 多Agent / 实战）
 ├── 📂 阶段三：RAG 检索增强
 │   ├── 基础（概述 / 数据处理 / 向量化 / 查询优化 / 检索策略）
 │   ├── 进阶（重排序 / 评估优化 / 高级索引 / 生成优化 / 反思技术）
 │   └── 前沿（GraphRAG / AgenticRAG / CorrectiveRAG / MultiModalRAG / LongRAG）
 ├── 📂 阶段四：Agent 智能体
 │   ├── 核心（概述 / 核心组件 / 设计模式 / 多智能体）
 │   ├── 协议（MCP / A2A / AG-UI）
 │   ├── 框架（LangChain / AutoGen / CrewAI）
 │   └── 工程（安全治理 / 评估工程化 / 具身智能）
 ├── 📂 阶段五：工程化实践
 │   └── LangSmith / 评估体系 / Tracing / 安全防护 / 生产部署
 └── 📖 更新记录

这里给大家精心整理了一份全面的AI大模型学习资源，包括：AI大模型全套学习路线图（从入门到实战）、精品AI大模型学习书籍手册、视频教程、实战学习、面试题等，资料免费分享！

👇👇扫码免费领取全部内容👇👇
在这里插入图片描述