LLM应用开发学习路线

SmellCleaner · 2026-04-02 19:59:41 发布

最近投入了大量时间深耕LLM应用开发，从基础的API调用，到搭建RAG检索增强系统、开发Agent智能体，整个学习过程踩了不少坑，也逐步梳理出一条逻辑清晰、可落地的学习路线，分享给同样正在入门的伙伴：

学习期间我整理了大量详细笔记，计划分5个系列逐步发布。这一篇作为总路线图，先帮大家理清整个知识体系的脉络，后续系列将逐一拆解每个阶段的核心知识点与实战技巧。
在这里插入图片描述

一、Transformer 基础——理解模型到底在做什么

这是整个学习路线的起点，也是关键前提。如果不掌握Transformer的核心原理，后续学习框架、搭建应用时，很多逻辑都会难以理解。这部分笔记围绕6个核心主题展开，覆盖从输入到输出的完整数据流，帮你吃透模型底层：

吃透这部分内容，既能清晰理解模型内部的工作逻辑，也能快速上手API调用、写出高质量Prompt，为后续学习框架、搭建复杂应用打下坚实基础。

二、LangChain + LangGraph 框架——从零散调用到系统化应用

会调基础API后，遇到多轮对话、文档检索、工具调用等场景时，手写全部逻辑不仅繁琐，还容易出错。LangChain是目前LLM应用开发的主流框架，LangGraph作为其工作流编排扩展，能实现更灵活的流程控制，两者结合可快速实现系统化应用开发。这部分笔记分为12个主题，兼顾理论与实操：

LangChain 部分：

LangGraph 部分：

学完这部分，基本能独立搭建对话机器人、RAG问答系统、简单Agent助手，实现从“会调用”到“会开发”的跨越。

三、RAG 检索增强——让模型能查知识库、答专业问题

大模型虽“博学”，但在专业领域容易出现幻觉、答非所问。RAG（检索增强生成）是目前企业落地最广泛的解决方案——给模型“外挂”一个专属知识库，让模型先检索、再生成，大幅提升回答的准确性和专业性。这部分笔记内容最细致，涵盖10个核心主题，覆盖全链路实操：

走完这条学习线，就能熟练掌握从数据处理到检索优化、质量评估的完整链路，轻松落地专业领域的问答系统。

四、Agent 智能体——让模型学会使用工具、自主决策

Agent是目前LLM应用开发的热门方向，核心是让模型跳出“被动应答”的局限，实现自主规划任务、调用工具、甚至多Agent协作，真正实现“会办事”。这部分笔记围绕8个主题展开，兼顾理论架构与实战落地，同时标注当前技术版本，适配快速迭代的行业节奏：

概述：从聊天机器人到自主决策智能体的升级逻辑，拆解Agent的核心认知架构
核心组件：一个能落地干活的Agent，必须具备的五大模块——感知、规划、记忆、工具、执行器
设计模式：不同任务场景下的Agent思考模式，详解ReAct、Plan-and-Solve、Reflection、Tree of Thoughts的适用场景与实现方法
MCP 协议：Anthropic推出的工具标准化协议，让Agent的工具调用有了统一接口，降低开发成本
A2A 协议：Google的Agent间通信标准，详解Agent之间如何实现对话、协作与任务分配
多智能体系统：深入拆解Supervisor和Swarm两种协作模式，学会将复杂任务拆分给多个Agent分工完成
安全与治理：Prompt注入的常见攻击手段与防护策略，以及Agent的权限控制方法，确保自主行动可控
实战应用：手把手搭建一个能自主调用工具、会反思优化的智能助手，落地实际应用场景