最近投入了大量时间深耕LLM应用开发,从基础的API调用,到搭建RAG检索增强系统、开发Agent智能体,整个学习过程踩了不少坑,也逐步梳理出一条逻辑清晰、可落地的学习路线,分享给同样正在入门的伙伴:

  • Transformer 基础 → 吃透模型底层逻辑,筑牢学习根基

  • LangChain / LangGraph 框架 → 告别零散API调用,实现应用系统化编排

  • RAG 检索增强 → 为模型外挂知识库,精准响应专业领域问题

  • Agent 智能体 → 让模型学会自主调用工具、规划决策,突破“问一句答一句”的局限

  • 工程化实践 → 打通从Demo到生产部署的最后一公里,实现落地可用

学习期间我整理了大量详细笔记,计划分5个系列逐步发布。这一篇作为总路线图,先帮大家理清整个知识体系的脉络,后续系列将逐一拆解每个阶段的核心知识点与实战技巧。
在这里插入图片描述

一、Transformer 基础——理解模型到底在做什么

这是整个学习路线的起点,也是关键前提。如果不掌握Transformer的核心原理,后续学习框架、搭建应用时,很多逻辑都会难以理解。这部分笔记围绕6个核心主题展开,覆盖从输入到输出的完整数据流,帮你吃透模型底层:

  • Tokenizer 分词器:文字如何被切分为模型可处理的Token,核心逻辑与实操方法

  • Embedding 向量:Token如何转化为模型能理解的数字向量,以及余弦相似度的计算逻辑与应用场景

  • Attention 机制:拆解QKV核心原理,搞懂模型为何能“记住”长文本中的关键信息(比如读到第500个词时,仍能关联第3个词)

  • Transformer 概述:同为Transformer架构,GPT擅长生成、BERT擅长理解的核心差异的是什么

  • Prompt Engineering:揭秘“同模型不同效果”的关键——高效Prompt的设计技巧与避坑指南

  • API 调用实践:手把手教你对接OpenAI、Claude、通义千问等主流大模型API,实现基础调用落地

吃透这部分内容,既能清晰理解模型内部的工作逻辑,也能快速上手API调用、写出高质量Prompt,为后续学习框架、搭建复杂应用打下坚实基础。

二、LangChain + LangGraph 框架——从零散调用到系统化应用

会调基础API后,遇到多轮对话、文档检索、工具调用等场景时,手写全部逻辑不仅繁琐,还容易出错。LangChain是目前LLM应用开发的主流框架,LangGraph作为其工作流编排扩展,能实现更灵活的流程控制,两者结合可快速实现系统化应用开发。这部分笔记分为12个主题,兼顾理论与实操:

LangChain 部分:

  • 概述:拆解“为什么不直接调API,非要用框架”——框架的核心价值与应用场景

  • Model I/O:掌握与模型对话的标准姿势,包括模型接口对接、Prompt模板设计、输出解析技巧

  • Chain 链:学会用LCEL表达式语言,通过管道操作符将多个步骤串联,实现流程自动化

  • Memory 记忆:解决对话机器人“失忆”问题,实现上下文记忆与多轮对话连贯衔接

  • Retrieval 检索:详解文档加载、分割、向量存储的全流程,掌握RAG系统在LangChain中的搭建方法

  • Agent 智能体:理解ReAct模式,让模型学会自主调用外部工具,突破基础对话局限

LangGraph 部分:

  • 核心概念:吃透StateGraph、Node、Edge三大核心,学会用状态图描述复杂工作流

  • 状态管理与流程控制:掌握条件分支、循环、并行执行的实现方法,比线性Chain更灵活适配复杂场景

  • 持久化与检查点:解决长任务中断问题,实现“断点续传”,提升开发效率

  • Human-in-the-Loop:实现敏感操作人工确认,让Agent在可控范围内自主行动,规避风险

  • 多 Agent 协作:掌握Supervisor和Swarm两种协作模式,实现多Agent分工配合,应对复杂任务

  • 实战应用:手把手实现ReAct、Plan-Execute、Reflection等5种主流工作流模式,快速落地实操

学完这部分,基本能独立搭建对话机器人、RAG问答系统、简单Agent助手,实现从“会调用”到“会开发”的跨越。

三、RAG 检索增强——让模型能查知识库、答专业问题

大模型虽“博学”,但在专业领域容易出现幻觉、答非所问。RAG(检索增强生成)是目前企业落地最广泛的解决方案——给模型“外挂”一个专属知识库,让模型先检索、再生成,大幅提升回答的准确性和专业性。这部分笔记内容最细致,涵盖10个核心主题,覆盖全链路实操:

  • 概述:搞懂RAG的核心逻辑,以及“为什么不直接微调,选择RAG”——轻量、灵活、可迭代的知识扩展优势

  • 数据处理:文档切块的核心技巧——避免切太碎导致语义丢失、切太大无法输入模型的坑

  • 向量化:Embedding模型的选型指南,以及向量数据库的使用方法与实操注意事项

  • 查询优化:解决用户问题表述模糊、检索不准的问题,详解Multi Query、RAG-Fusion、HyDE等优化方法

  • 检索策略:语义检索与关键词检索的协同技巧,掌握混合检索、父文档检索的实现逻辑

  • 重排序:从检索到的海量结果中,快速筛选出最相关的内容,提升回答精准度

  • 评估与优化:用RAGAS框架量化检索质量,精准发现并抑制模型幻觉,提升系统可靠性

  • GraphRAG:当向量检索无法应对复杂关系推理时,知识图谱与RAG的融合解决方案

  • AgenticRAG:让Agent自主决定是否需要检索、检索什么内容——RAG的进阶应用方向

  • 实战应用:从零搭建企业知识库问答系统的完整流程,涵盖数据处理、检索优化、部署测试全环节

走完这条学习线,就能熟练掌握从数据处理到检索优化、质量评估的完整链路,轻松落地专业领域的问答系统。

四、Agent 智能体——让模型学会使用工具、自主决策

Agent是目前LLM应用开发的热门方向,核心是让模型跳出“被动应答”的局限,实现自主规划任务、调用工具、甚至多Agent协作,真正实现“会办事”。这部分笔记围绕8个主题展开,兼顾理论架构与实战落地,同时标注当前技术版本,适配快速迭代的行业节奏:

  • 概述:从聊天机器人到自主决策智能体的升级逻辑,拆解Agent的核心认知架构

  • 核心组件:一个能落地干活的Agent,必须具备的五大模块——感知、规划、记忆、工具、执行器

  • 设计模式:不同任务场景下的Agent思考模式,详解ReAct、Plan-and-Solve、Reflection、Tree of Thoughts的适用场景与实现方法

  • MCP 协议:Anthropic推出的工具标准化协议,让Agent的工具调用有了统一接口,降低开发成本

  • A2A 协议:Google的Agent间通信标准,详解Agent之间如何实现对话、协作与任务分配

  • 多智能体系统:深入拆解Supervisor和Swarm两种协作模式,学会将复杂任务拆分给多个Agent分工完成

  • 安全与治理:Prompt注入的常见攻击手段与防护策略,以及Agent的权限控制方法,确保自主行动可控

  • 实战应用:手把手搭建一个能自主调用工具、会反思优化的智能助手,落地实际应用场景

五、工程化实践——从Demo到生产的最后一公里

懂原理、跑通Demo,并不意味着能落地生产。这部分是我学习过程中踩坑最多的环节,也是从“开发者”到“工程化实践者”的关键一步,笔记围绕5个核心主题,系统梳理上线前的必备技能:

  • LangSmith 追踪与评估:LLM应用的链路追踪方法,快速定位调用链中的问题,提升调试效率

  • Agent 评估体系:详解AgentBench等主流评估框架,掌握衡量智能体性能的核心指标与方法

  • Tracing 链路追踪:分布式追踪与可观测性的实操技巧,轻松排查线上应用的各类问题

  • Prompt 注入防护:LLM应用安全的第一课,全面梳理常见攻击手段与可落地的防护策略

  • 生产部署实践:打通从Demo到生产的最后一公里,涵盖部署方案、监控告警、成本优化的全流程技巧

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐