学了大半年大模型应用开发,整理了这份路线图
最近花了不少时间学 LLM 应用开发,从调 API 到搭 RAG、做 Agent,整个过程踩了不少坑,也理出了一条自己觉得比较顺的学习路线:
- • Transformer 基础 → 先搞懂模型到底在做什么
- • LangChain / LangGraph 框架 → 把零散的 API 调用编排成应用
- • RAG 检索增强 → 让模型能查知识库、答专业问题
- • Agent 智能体 → 让模型学会使用工具、自主决策
- • 工程化实践 → 把 Demo 变成能上线的生产系统

学习过程中做了大量笔记,打算整理成系列发出来。这篇是总路线图,先把整个知识体系的脉络理一遍。

5 个系列

① Transformer 基础——理解模型到底在做什么
起点。不了解 Transformer,后面很多东西理解起来会很吃力。这部分笔记覆盖从输入到输出的完整数据流,6 个主题:
- • Tokenizer 分词器 :文字怎么被切分为 Token
- • Embedding 向量 :Token 怎么变成模型能理解的数字,余弦相似度怎么算
- • Attention 机制 :模型读到第 500 个词时,怎么还能"记住"第 3 个词——QKV 到底在算什么
- • Transformer 概述 :GPT 和 BERT 都是 Transformer,为什么一个擅长生成、一个擅长理解
- • Prompt Engineering :同一个模型,为什么有人用得好有人用得差——差在 Prompt 上
- • API 调用实践 :OpenAI、Claude、通义千问等大模型 API 怎么接、怎么调
这部分搞清楚之后,既理解了模型内部在做什么,也能实际上手调 API、写好 Prompt——后面学框架和搭应用就有底了。
② LangChain + LangGraph 框架——从零散调用到系统化应用
会调 API 之后,需要多轮对话、文档检索、工具调用时,手写全部逻辑很痛苦。LangChain 是目前最主流的 LLM 应用开发框架,LangGraph 是它的工作流编排扩展,两者放在一起整理,12 个主题:
LangChain 部分:
- • 概述 :为什么不直接调 API 而要用框架
- • Model I/O :模型接口、Prompt 模板和输出解析——跟模型对话的标准姿势
- • Chain 链 :LCEL 表达式语言,用管道操作符把多个步骤串起来
- • Memory 记忆 :让对话机器人记住上下文,不会每轮都"失忆"
- • Retrieval 检索 :文档加载、分割、向量存储——RAG 系统在 LangChain 里怎么搭
- • Agent 智能体 :ReAct 模式,让模型学会调用外部工具
LangGraph 部分:
- • 核心概念 :StateGraph、Node、Edge——用状态图描述工作流
- • 状态管理与流程控制 :条件分支、循环、并行执行——比线性 Chain 灵活得多
- • 持久化与检查点 :长任务怎么"断点续传"
- • Human-in-the-Loop :敏感操作让人确认,Agent 不能全自动
- • 多 Agent 协作 :Supervisor 和 Swarm 两种模式,让多个 Agent 分工合作
- • 实战应用 :ReAct、Plan-Execute、Reflection 等 5 种工作流模式实现
这部分学完,基本就能自己搭对话机器人、RAG 问答、简单的 Agent 助手了。
③ RAG 检索增强——让模型能查知识库、答专业问题
大模型什么都知道一点,但专业领域经常答错。RAG 是目前企业落地最常见的方案——给模型"外挂"一个知识库,先查再答。这部分笔记比较多,10 个主题:
- • 概述 :RAG 是什么,为什么不直接微调——比微调更轻量、更灵活的知识扩展方案
- • 数据处理 :文档怎么切块——切太碎找不到,切太大塞不下
- • 向量化 :Embedding 模型怎么选,向量数据库怎么用
- • 查询优化 :用户的问题不好搜,怎么帮他重新问——Multi Query、RAG-Fusion、HyDE
- • 检索策略 :语义检索 + 关键词检索怎么配合——混合检索和父文档检索
- • 重排序 :检索到了 100 条,怎么挑出最相关的 5 条
- • 评估与优化 :用 RAGAS 框架量化检索质量,发现和抑制模型幻觉
- • GraphRAG :当向量检索搞不定复杂关系推理,知识图谱 + RAG 的融合方案
- • AgenticRAG :让 Agent 自己决定要不要检索——RAG 的下一步
- • 实战应用 :从零搭建企业知识库问答系统的完整流程
走完这条线,从数据处理到检索优化到质量评估的完整链路就通了。
④ Agent 智能体——让模型学会使用工具、自主决策
现在最热的方向。模型不再只是"问一句答一句",而是能自己规划任务、调用工具、甚至多个 Agent 协作。8 个主题:
- • 概述 :从聊天机器人到自主决策的智能体——Agent 的核心认知架构
- • 核心组件 :一个能干活的 Agent 需要五个模块——感知、规划、记忆、工具、执行器
- • 设计模式 :不同任务该让 Agent 怎么思考——ReAct、Plan-and-Solve、Reflection、Tree of Thoughts
- • MCP 协议 :Anthropic 推出的工具标准化协议——让 Agent 的工具调用有了统一接口
- • A2A 协议 :Google 的 Agent 间通信标准——Agent 之间怎么对话和协作
- • 多智能体系统 :Supervisor 和 Swarm 两种协作模式——复杂任务怎么分给多个 Agent
- • 安全与治理 :Prompt 注入防护、权限控制——让 Agent 在可控范围内自主行动
- • 实战应用 :搭建一个能用工具、会反思的智能助手
这部分变化很快,笔记里会尽量标注当时的技术版本。
⑤ 工程化实践——从 Demo 到生产的最后一公里
原理懂了、Demo 跑通了,上线前还差不少东西。这部分是踩坑最多的地方,5 个主题:
- • LangSmith 追踪与评估 :LLM 应用的链路追踪怎么做,调用链出了问题怎么定位
- • Agent 评估体系 :怎么衡量一个智能体的好坏——AgentBench 等评估框架
- • Tracing 链路追踪 :分布式追踪和可观测性——线上问题的排查利器
- • Prompt 注入防护 :LLM 应用的安全第一课——攻击手段和防护策略
- • 生产部署实践 :从 Demo 到生产的最后一公里——部署、监控、成本优化
这些在网上比较零散,我尽量整理成系统的笔记。
知识库
完整的笔记我放在了知识库里,方便按主题翻阅:

知识库目录结构:

这里发的是快速入门和知识详解。知识库里还有一些额外的内容:
- • 快速入门 :核心概念速览,几分钟过一遍,也方便以后翻出来快速回忆
- • 知识详解 :把原理和用法写清楚,学的时候当主力看
- • 知识导图 :梳理知识结构,复习的时候用来快速定位
- • 知识导图 ——方便回顾时快速定位
- • 实战案例 ——完整项目的代码和过程记录
- • 进阶内容 ——CorrectiveRAG、MultiModalRAG、具身智能、多框架对比等这里还没发的部分
关于我
我是大数据开发工程师,曾任职多家互联网公司,现就职于字节。目前正在学习大模型应用开发,AI 时代持续精进,拒绝被淘汰。
最后
选择AI大模型就是选择未来!最近两年,大家都可以看到AI的发展有多快,时代在瞬息万变,我们又为何不给自己多一个选择,多一个出路,多一个可能呢?
与其在传统行业里停滞不前,不如尝试一下新兴行业,而AI大模型恰恰是这两年的大风口,人才需求急为紧迫!
人工智能时代最缺的是什么?就是能动手解决问题还会动脑创新的技术牛人!智泊AI为了让学员毕业后快速成为抢手的AI人才,直接把课程升级到了V6.0版本。
这个课程就像搭积木一样,既有机器学习、深度学习这些基本功教学,又教大家玩转大模型开发、处理图片语音等多种数据的新潮技能,把AI技术从基础到前沿全部都包圆了!
课堂上不光教理论,还带着学员做了十多个真实项目。学员要亲自上手搞数据清洗、模型调优这些硬核操作,把课本知识变成真本事!

课程还教大家怎么和AI搭档一起工作,就像程序员带着智能助手写代码、优化方案,效率直接翻倍!
这么练出来的学员确实吃香,83%的应届生都进了大厂搞研发,平均工资比同行高出四成多。
智泊AI还特别注重培养"人无我有"的能力,比如需求分析、创新设计这些AI暂时替代不了的核心竞争力,让学员在AI时代站稳脚跟。
课程优势一:人才库优秀学员参与真实商业项目实训

课程优势二:与大厂深入合作,共建大模型课程

课程优势三:海外高校学历提升

课程优势四:热门岗位全覆盖,匹配企业岗位需求

如果说你是以下人群中的其中一类,都可以来智泊AI学习人工智能,找到高薪工作,一次小小的“投资”换来的是终身受益!
·应届毕业生:无工作经验但想要系统学习AI大模型技术,期待通过实战项目掌握核心技术。
·零基础转型:非技术背景但关注AI应用场景,计划通过低代码工具实现“AI+行业”跨界。
·业务赋能 突破瓶颈:传统开发者(Java/前端等)学习Transformer架构与LangChain框架,向AI全栈工程师转型。

智泊AI始终秉持着“让每个人平等享受到优质教育资源”的育人理念,通过动态追踪大模型开发、数据标注伦理等前沿技术趋势,构建起"前沿课程+智能实训+精准就业"的高效培养体系。
重磅消息
人工智能V6.0升级两大班型:AI大模型全栈班、AI大模型算法班,为学生提供更多选择。


由于文章篇幅有限,在这里我就不一一向大家展示了,学习AI大模型是一项系统工程,需要时间和持续的努力。但随着技术的发展和在线资源的丰富,零基础的小白也有很好的机会逐步学习和掌握。
【最新最全版】AI大模型全套学习籽料(可无偿送):LLM面试题+AI大模型学习路线+大模型PDF书籍+640套AI大模型报告等等,从入门到进阶再到精通,超全面存下吧!
获取方式:有需要的小伙伴,可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】
来智泊AI,高起点就业
培养企业刚需人才
扫码咨询 抢免费试学
⬇⬇⬇


AI大模型学习之路,道阻且长,但只要你坚持下去,就一定会有收获。
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐



所有评论(0)