学了大半年大模型应用开发，整理了这份路线图

AIGC安琪

340人浏览 · 2026-03-23 15:33:08

AIGC安琪 · 2026-03-23 15:33:08 发布

最近花了不少时间学 LLM 应用开发，从调 API 到搭 RAG、做 Agent，整个过程踩了不少坑，也理出了一条自己觉得比较顺的学习路线：

• Transformer 基础 → 先搞懂模型到底在做什么
• LangChain / LangGraph 框架 → 把零散的 API 调用编排成应用
• RAG 检索增强 → 让模型能查知识库、答专业问题
• Agent 智能体 → 让模型学会使用工具、自主决策
• 工程化实践 → 把 Demo 变成能上线的生产系统

学习过程中做了大量笔记，打算整理成系列发出来。这篇是总路线图，先把整个知识体系的脉络理一遍。

在这里插入图片描述

5 个系列

① Transformer 基础——理解模型到底在做什么

起点。不了解 Transformer，后面很多东西理解起来会很吃力。这部分笔记覆盖从输入到输出的完整数据流，6 个主题：

• Tokenizer 分词器 ：文字怎么被切分为 Token
• Embedding 向量 ：Token 怎么变成模型能理解的数字，余弦相似度怎么算
• Attention 机制 ：模型读到第 500 个词时，怎么还能"记住"第 3 个词——QKV 到底在算什么
• Transformer 概述 ：GPT 和 BERT 都是 Transformer，为什么一个擅长生成、一个擅长理解
• Prompt Engineering ：同一个模型，为什么有人用得好有人用得差——差在 Prompt 上
• API 调用实践 ：OpenAI、Claude、通义千问等大模型 API 怎么接、怎么调

这部分搞清楚之后，既理解了模型内部在做什么，也能实际上手调 API、写好 Prompt——后面学框架和搭应用就有底了。

② LangChain + LangGraph 框架——从零散调用到系统化应用

会调 API 之后，需要多轮对话、文档检索、工具调用时，手写全部逻辑很痛苦。LangChain 是目前最主流的 LLM 应用开发框架，LangGraph 是它的工作流编排扩展，两者放在一起整理，12 个主题：

LangChain 部分：

• 概述：为什么不直接调 API 而要用框架
• Model I/O ：模型接口、Prompt 模板和输出解析——跟模型对话的标准姿势
• Chain 链 ：LCEL 表达式语言，用管道操作符把多个步骤串起来
• Memory 记忆 ：让对话机器人记住上下文，不会每轮都"失忆"
• Retrieval 检索 ：文档加载、分割、向量存储——RAG 系统在 LangChain 里怎么搭
• Agent 智能体 ：ReAct 模式，让模型学会调用外部工具

LangGraph 部分：

• 核心概念 ：StateGraph、Node、Edge——用状态图描述工作流
• 状态管理与流程控制 ：条件分支、循环、并行执行——比线性 Chain 灵活得多
• 持久化与检查点 ：长任务怎么"断点续传"
• Human-in-the-Loop ：敏感操作让人确认，Agent 不能全自动
• 多 Agent 协作 ：Supervisor 和 Swarm 两种模式，让多个 Agent 分工合作
• 实战应用 ：ReAct、Plan-Execute、Reflection 等 5 种工作流模式实现

这部分学完，基本就能自己搭对话机器人、RAG 问答、简单的 Agent 助手了。

③ RAG 检索增强——让模型能查知识库、答专业问题

大模型什么都知道一点，但专业领域经常答错。RAG 是目前企业落地最常见的方案——给模型"外挂"一个知识库，先查再答。这部分笔记比较多，10 个主题：

• 概述：RAG 是什么，为什么不直接微调——比微调更轻量、更灵活的知识扩展方案
• 数据处理 ：文档怎么切块——切太碎找不到，切太大塞不下
• 向量化 ：Embedding 模型怎么选，向量数据库怎么用
• 查询优化 ：用户的问题不好搜，怎么帮他重新问——Multi Query、RAG-Fusion、HyDE
• 检索策略 ：语义检索 + 关键词检索怎么配合——混合检索和父文档检索
• 重排序 ：检索到了 100 条，怎么挑出最相关的 5 条
• 评估与优化 ：用 RAGAS 框架量化检索质量，发现和抑制模型幻觉
• GraphRAG ：当向量检索搞不定复杂关系推理，知识图谱 + RAG 的融合方案
• AgenticRAG ：让 Agent 自己决定要不要检索——RAG 的下一步
• 实战应用 ：从零搭建企业知识库问答系统的完整流程

走完这条线，从数据处理到检索优化到质量评估的完整链路就通了。

④ Agent 智能体——让模型学会使用工具、自主决策

现在最热的方向。模型不再只是"问一句答一句"，而是能自己规划任务、调用工具、甚至多个 Agent 协作。8 个主题：

• 概述：从聊天机器人到自主决策的智能体——Agent 的核心认知架构
• 核心组件 ：一个能干活的 Agent 需要五个模块——感知、规划、记忆、工具、执行器
• 设计模式 ：不同任务该让 Agent 怎么思考——ReAct、Plan-and-Solve、Reflection、Tree of Thoughts
• MCP 协议 ：Anthropic 推出的工具标准化协议——让 Agent 的工具调用有了统一接口
• A2A 协议 ：Google 的 Agent 间通信标准——Agent 之间怎么对话和协作
• 多智能体系统 ：Supervisor 和 Swarm 两种协作模式——复杂任务怎么分给多个 Agent
• 安全与治理 ：Prompt 注入防护、权限控制——让 Agent 在可控范围内自主行动
• 实战应用 ：搭建一个能用工具、会反思的智能助手

这部分变化很快，笔记里会尽量标注当时的技术版本。

⑤ 工程化实践——从 Demo 到生产的最后一公里

原理懂了、Demo 跑通了，上线前还差不少东西。这部分是踩坑最多的地方，5 个主题：

• LangSmith 追踪与评估 ：LLM 应用的链路追踪怎么做，调用链出了问题怎么定位
• Agent 评估体系 ：怎么衡量一个智能体的好坏——AgentBench 等评估框架
• Tracing 链路追踪 ：分布式追踪和可观测性——线上问题的排查利器
• Prompt 注入防护 ：LLM 应用的安全第一课——攻击手段和防护策略
• 生产部署实践 ：从 Demo 到生产的最后一公里——部署、监控、成本优化

这些在网上比较零散，我尽量整理成系统的笔记。

知识库

完整的笔记我放在了知识库里，方便按主题翻阅：

知识库目录结构：

在这里插入图片描述

这里发的是快速入门和知识详解。知识库里还有一些额外的内容：

• 快速入门 ：核心概念速览，几分钟过一遍，也方便以后翻出来快速回忆
• 知识详解 ：把原理和用法写清楚，学的时候当主力看
• 知识导图 ：梳理知识结构，复习的时候用来快速定位
• 知识导图 ——方便回顾时快速定位
• 实战案例 ——完整项目的代码和过程记录
• 进阶内容 ——CorrectiveRAG、MultiModalRAG、具身智能、多框架对比等这里还没发的部分

关于我

我是大数据开发工程师，曾任职多家互联网公司，现就职于字节。目前正在学习大模型应用开发，AI 时代持续精进，拒绝被淘汰。

最后

选择AI大模型就是选择未来！最近两年，大家都可以看到AI的发展有多快，时代在瞬息万变，我们又为何不给自己多一个选择，多一个出路，多一个可能呢？

与其在传统行业里停滞不前，不如尝试一下新兴行业，而AI大模型恰恰是这两年的大风口，人才需求急为紧迫！

人工智能时代最缺的是什么？就是能动手解决问题还会动脑创新的技术牛人！智泊AI为了让学员毕业后快速成为抢手的AI人才，直接把课程升级到了V6.0版本‌。

这个课程就像搭积木一样，既有机器学习、深度学习这些基本功教学，又教大家玩转大模型开发、处理图片语音等多种数据的新潮技能，把AI技术从基础到前沿全部都包圆了！

课堂上不光教理论，还带着学员做了十多个真实项目。学员要亲自上手搞数据清洗、模型调优这些硬核操作，把课本知识变成真本事‌！

课程还教大家怎么和AI搭档一起工作，就像程序员带着智能助手写代码、优化方案，效率直接翻倍‌！

这么练出来的学员确实吃香，83%的应届生都进了大厂搞研发，平均工资比同行高出四成多‌。

智泊AI还特别注重培养"人无我有"的能力，比如需求分析、创新设计这些AI暂时替代不了的核心竞争力，让学员在AI时代站稳脚跟‌。

课程优势一：人才库优秀学员参与真实商业项目实训

课程优势二：与大厂深入合作，共建大模型课程

课程优势三：海外高校学历提升

课程优势四：热门岗位全覆盖，匹配企业岗位需求

如果说你是以下人群中的其中一类，都可以来智泊AI学习人工智能，找到高薪工作，一次小小的“投资”换来的是终身受益！

·应届毕业生‌：无工作经验但想要系统学习AI大模型技术，期待通过实战项目掌握核心技术。

·零基础转型‌：非技术背景但关注AI应用场景，计划通过低代码工具实现“AI+行业”跨界‌。

·业务赋能 ‌突破瓶颈：传统开发者（Java/前端等）学习Transformer架构与LangChain框架，向AI全栈工程师转型‌。

智泊AI始终秉持着“让每个人平等享受到优质教育资源”的育人理念‌，通过动态追踪大模型开发、数据标注伦理等前沿技术趋势‌，构建起"前沿课程+智能实训+精准就业"的高效培养体系。

重磅消息

人工智能V6.0升级两大班型：AI大模型全栈班、AI大模型算法班，为学生提供更多选择。

由于文章篇幅有限，在这里我就不一一向大家展示了，学习AI大模型是一项系统工程，需要时间和持续的努力。但随着技术的发展和在线资源的丰富，零基础的小白也有很好的机会逐步学习和掌握。

【最新最全版】AI大模型全套学习籽料（可无偿送）：LLM面试题+AI大模型学习路线+大模型PDF书籍+640套AI大模型报告等等，从入门到进阶再到精通，超全面存下吧！

获取方式：有需要的小伙伴，可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

来智泊AI，高起点就业

培养企业刚需人才

扫码咨询抢免费试学

⬇⬇⬇

在这里插入图片描述

AI大模型学习之路，道阻且长，但只要你坚持下去，就一定会有收获。

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

OpenClaw腾讯云搭建流程：2026年1分钟部署、配置大模型百炼APIKey、集成Skill保姆级教程

AtomGit开源社区

OpenClaw阿里云快速部署教程：2026年5分钟搞定、配置大模型百炼APIKey、集成Skill

AtomGit开源社区

2026年4月OpenClaw搭建指南：云端服务器部署OpenClaw、配置百炼APIKey、集成Skill超详细流程

AtomGit开源社区

所有评论(0)

查看更多评论

AIGC安琪

@2401_85725028

已为社区贡献7条内容