图片

最近花了不少时间学 LLM 应用开发,从调 API 到搭 RAG、做 Agent,整个过程踩了不少坑,也理出了一条自己觉得比较顺的学习路线:

  • Transformer 基础 → 先搞懂模型到底在做什么
  • LangChain / LangGraph 框架 → 把零散的 API 调用编排成应用
  • RAG 检索增强 → 让模型能查知识库、答专业问题
  • Agent 智能体 → 让模型学会使用工具、自主决策
  • 工程化实践 → 把 Demo 变成能上线的生产系统

学习过程中做了大量笔记,打算整理成系列发出来。这篇是总路线图,先把整个知识体系的脉络理一遍。


5 个系列

图片

① Transformer 基础——理解模型到底在做什么

起点。不了解 Transformer,后面很多东西理解起来会很吃力。这部分笔记覆盖从输入到输出的完整数据流,6 个主题:

  • Tokenizer 分词器 :文字怎么被切分为 Token
  • Embedding 向量 :Token 怎么变成模型能理解的数字,余弦相似度怎么算
  • Attention 机制 :模型读到第 500 个词时,怎么还能"记住"第 3 个词——QKV 到底在算什么
  • Transformer 概述 :GPT 和 BERT 都是 Transformer,为什么一个擅长生成、一个擅长理解
  • Prompt Engineering :同一个模型,为什么有人用得好有人用得差——差在 Prompt 上
  • API 调用实践 :OpenAI、Claude、通义千问等大模型 API 怎么接、怎么调

这部分搞清楚之后,既理解了模型内部在做什么,也能实际上手调 API、写好 Prompt——后面学框架和搭应用就有底了。


② LangChain + LangGraph 框架——从零散调用到系统化应用

会调 API 之后,需要多轮对话、文档检索、工具调用时,手写全部逻辑很痛苦。LangChain 是目前最主流的 LLM 应用开发框架,LangGraph 是它的工作流编排扩展,两者放在一起整理,12 个主题:

LangChain 部分:

  • 概述 :为什么不直接调 API 而要用框架
  • Model I/O :模型接口、Prompt 模板和输出解析——跟模型对话的标准姿势
  • Chain 链 :LCEL 表达式语言,用管道操作符把多个步骤串起来
  • Memory 记忆 :让对话机器人记住上下文,不会每轮都"失忆"
  • Retrieval 检索 :文档加载、分割、向量存储——RAG 系统在 LangChain 里怎么搭
  • Agent 智能体 :ReAct 模式,让模型学会调用外部工具

LangGraph 部分:

  • 核心概念 :StateGraph、Node、Edge——用状态图描述工作流
  • 状态管理与流程控制 :条件分支、循环、并行执行——比线性 Chain 灵活得多
  • 持久化与检查点 :长任务怎么"断点续传"
  • Human-in-the-Loop :敏感操作让人确认,Agent 不能全自动
  • 多 Agent 协作 :Supervisor 和 Swarm 两种模式,让多个 Agent 分工合作
  • 实战应用 :ReAct、Plan-Execute、Reflection 等 5 种工作流模式实现

这部分学完,基本就能自己搭对话机器人、RAG 问答、简单的 Agent 助手了。


③ RAG 检索增强——让模型能查知识库、答专业问题

大模型什么都知道一点,但专业领域经常答错。RAG 是目前企业落地最常见的方案——给模型"外挂"一个知识库,先查再答。这部分笔记比较多,10 个主题:

  • 概述 :RAG 是什么,为什么不直接微调——比微调更轻量、更灵活的知识扩展方案
  • 数据处理 :文档怎么切块——切太碎找不到,切太大塞不下
  • 向量化 :Embedding 模型怎么选,向量数据库怎么用
  • 查询优化 :用户的问题不好搜,怎么帮他重新问——Multi Query、RAG-Fusion、HyDE
  • 检索策略 :语义检索 + 关键词检索怎么配合——混合检索和父文档检索
  • 重排序 :检索到了 100 条,怎么挑出最相关的 5 条
  • 评估与优化 :用 RAGAS 框架量化检索质量,发现和抑制模型幻觉
  • GraphRAG :当向量检索搞不定复杂关系推理,知识图谱 + RAG 的融合方案
  • AgenticRAG :让 Agent 自己决定要不要检索——RAG 的下一步
  • 实战应用 :从零搭建企业知识库问答系统的完整流程

走完这条线,从数据处理到检索优化到质量评估的完整链路就通了。


④ Agent 智能体——让模型学会使用工具、自主决策

现在最热的方向。模型不再只是"问一句答一句",而是能自己规划任务、调用工具、甚至多个 Agent 协作。8 个主题:

  • 概述 :从聊天机器人到自主决策的智能体——Agent 的核心认知架构
  • 核心组件 :一个能干活的 Agent 需要五个模块——感知、规划、记忆、工具、执行器
  • 设计模式 :不同任务该让 Agent 怎么思考——ReAct、Plan-and-Solve、Reflection、Tree of Thoughts
  • MCP 协议 :Anthropic 推出的工具标准化协议——让 Agent 的工具调用有了统一接口
  • A2A 协议 :Google 的 Agent 间通信标准——Agent 之间怎么对话和协作
  • 多智能体系统 :Supervisor 和 Swarm 两种协作模式——复杂任务怎么分给多个 Agent
  • 安全与治理 :Prompt 注入防护、权限控制——让 Agent 在可控范围内自主行动
  • 实战应用 :搭建一个能用工具、会反思的智能助手

这部分变化很快,笔记里会尽量标注当时的技术版本。


⑤ 工程化实践——从 Demo 到生产的最后一公里

原理懂了、Demo 跑通了,上线前还差不少东西。这部分是踩坑最多的地方,5 个主题:

  • LangSmith 追踪与评估 :LLM 应用的链路追踪怎么做,调用链出了问题怎么定位
  • Agent 评估体系 :怎么衡量一个智能体的好坏——AgentBench 等评估框架
  • Tracing 链路追踪 :分布式追踪和可观测性——线上问题的排查利器
  • Prompt 注入防护 :LLM 应用的安全第一课——攻击手段和防护策略
  • 生产部署实践 :从 Demo 到生产的最后一公里——部署、监控、成本优化

这些在网上比较零散,我尽量整理成系统的笔记。


完整笔记

完整的笔记我放在了飞书知识库里,方便按主题翻阅:

图片

知识库目录结构:

📚 大模型应用开发学习笔记
 ├── 📖 大模型应用开发学习路线图
 ├── 📂 阶段一:Transformer 基础
 │   ├── 1. 概述(快速入门 / 知识详解 / 知识导图)
 │   ├── 2. Attention 机制
 │   ├── 3. Embedding 向量
 │   ├── 4. Tokenizer 分词器
 │   ├── 5. Prompt Engineering
 │   └── 6. API 调用实践
 ├── 📂 阶段二:LangChain + LangGraph 框架
 │   ├── LangChain(概述 / Model I/O / Chain / Memory / Retrieval / Agent / LangSmith / 实战)
 │   └── LangGraph(核心概念 / 状态管理 / 流程控制 / 持久化 / 人机协作 / 多Agent / 实战)
 ├── 📂 阶段三:RAG 检索增强
 │   ├── 基础(概述 / 数据处理 / 向量化 / 查询优化 / 检索策略)
 │   ├── 进阶(重排序 / 评估优化 / 高级索引 / 生成优化 / 反思技术)
 │   └── 前沿(GraphRAG / AgenticRAG / CorrectiveRAG / MultiModalRAG / LongRAG)
 ├── 📂 阶段四:Agent 智能体
 │   ├── 核心(概述 / 核心组件 / 设计模式 / 多智能体)
 │   ├── 协议(MCP / A2A / AG-UI)
 │   ├── 框架(LangChain / AutoGen / CrewAI)
 │   └── 工程(安全治理 / 评估工程化 / 具身智能)
 ├── 📂 阶段五:工程化实践
 │   └── LangSmith / 评估体系 / Tracing / 安全防护 / 生产部署
 └── 📖 更新记录

这里给大家精心整理了一份全面的AI大模型学习资源包括:AI大模型全套学习路线图(从入门到实战)、精品AI大模型学习书籍手册、视频教程、实战学习、面试题等,资料免费分享

👇👇扫码免费领取全部内容👇👇
在这里插入图片描述

1. 成长路线图&学习规划

要学习一门新的技术,作为新手一定要先学习成长路线图方向不对,努力白费

这里,我们为新手和想要进一步提升的专业人士准备了一份详细的学习成长路线图和规划。可以说是最科学最系统的学习成长路线。
在这里插入图片描述

2. 大模型经典PDF书籍

书籍和学习文档资料是学习大模型过程中必不可少的,我们精选了一系列深入探讨大模型技术的书籍和学习文档,它们由领域内的顶尖专家撰写,内容全面、深入、详尽,为你学习大模型提供坚实的理论基础(书籍含电子版PDF)

在这里插入图片描述

3. 大模型视频教程

对于很多自学或者没有基础的同学来说,书籍这些纯文字类的学习教材会觉得比较晦涩难以理解,因此,我们提供了丰富的大模型视频教程,以动态、形象的方式展示技术概念,帮助你更快、更轻松地掌握核心知识

在这里插入图片描述

4. 2026行业报告

行业分析主要包括对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。

5. 大模型项目实战

学以致用 ,当你的理论知识积累到一定程度,就需要通过项目实战,在实际操作中检验和巩固你所学到的知识,同时为你找工作和职业发展打下坚实的基础。

在这里插入图片描述

6. 大模型面试题

面试不仅是技术的较量,更需要充分的准备。

在你已经掌握了大模型技术之后,就需要开始准备面试,我们将提供精心整理的大模型面试题库,涵盖当前面试中可能遇到的各种技术问题,让你在面试中游刃有余。

在这里插入图片描述

7. 资料领取:全套内容免费抱走,学 AI 不用再找第二份

不管你是 0 基础想入门 AI 大模型,还是有基础想冲刺大厂、了解行业趋势,这份资料都能满足你!
现在只需按照提示操作,就能免费领取:

👇👇扫码免费领取全部内容👇👇
在这里插入图片描述

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐