从零开始:0基础 Agent 开发课
从零开始:0基础 Agent 开发课
写于 2026 年 3 月
面向对象:完全没有 AI 开发经验的程序员,或Java开发、Python、前端开发想转到AI开发的程序员们。
先说结论
这门课能让你从零开始,系统掌握 AI 开发的完整技术栈——从数学基础、传统机器学习、深度学习,到大模型应用开发、Agent 构建、模型微调、生产化部署。
不需要有 AI 背景。需要的只是:会写代码。
你可能有这样的困惑
2022 年底 ChatGPT 出来之后,身边越来越多的人在做 AI 相关的东西。但你打开那些教程,要么是一堆数学公式,要么上来就是各种框架名词——LangChain、LangGraph、RAG、Agent——根本不知道从哪里入手。
或者你已经会调 API 了,但一到真实项目就卡住:
- 为什么换了几个词,模型输出质量就天差地别?
- Agent 跑起来了,但一直在绕圈子,不知道怎么调?
- RAG 知识库搭好了,检索出来的内容驴唇不对马嘴,怎么办?
- Demo 效果挺好,一上生产各种崩,问题出在哪?
这些问题靠"多试几次"解决不了。需要的是系统性的理解——从 LLM 工作原理,到 Prompt 设计,到 Agent 架构,到生产化工程。
这门课就是为了解决这个问题而设计的。
学完这门课,你能做到什么
按学习进度,你会依次获得这些能力:
学完第6-7章(约2周)→ 能做:命令行版个人 AI 助手
调用 DeepSeek API,维护对话历史,让 AI 记住你说过的话。这是第一个真实可用的项目。
学完第8章(约1周)→ 能做:稳定输出你想要格式的 AI
不再靠运气,学会用 Few-shot、CoT、结构化输出让模型按你的要求输出,成功率从 60% 提升到 95%+。
学完第11章(约2周)→ 能做:自己公司文档的智能问答系统
把 PDF、Word、网页变成可查询的知识库。问"上季度销售额是多少",AI 直接从你的文档里找答案。
学完第12章(约2周)→ 能做:能自主完成多步骤任务的 Agent
不只是回答问题,而是能搜索资料、调用工具、写代码、执行任务——自动完成需要多步操作的工作。
学完第18章(约1周)→ 能做:把 AI 功能上线到真实服务
不只是 Demo,而是有错误处理、成本控制、监控告警的生产级 AI 服务。
给有经验的工程师:如果你已经有项目经验,想解决具体问题,直接跳到对应章节:
- Agent 绕圈子停不下来 → 第12章 ReAct 终止条件 + 第13章 LangGraph 状态机
- RAG 检索内容不相关 → 第11章 文档分块策略、混合检索、重排序
- Demo 上生产就崩 → 第18章 错误处理、重试策略、成本控制
- 工具调用格式错误 → 第9章 Function Calling + 第12章 Agent 调试指南
Java 工程师,你的优势比你想象的大
很多 Java 开发者觉得转 AI 要从头开始,其实不是。
你已经有的东西,在 AI 工程化阶段直接用得上:
系统设计能力:Agent 系统本质上是一个分布式异步系统。你熟悉的微服务架构、消息队列、数据库设计,在 AI 应用的生产化阶段都是核心竞争力。
工程化意识:Java 生态的测试规范、CI/CD 流程、可观测性体系,大多数 Python AI 开发者反而不重视这些。你的工程化习惯是优势,不是负担。
API 设计经验:Function Calling 的本质是给 LLM 定义函数接口。你写了多年的 API 设计经验,在工具定义上直接复用。
数据库和 SQL 经验:RAG 系统的向量数据库、Text-to-SQL 应用——这些对你来说比对纯 Python 开发者上手快得多。
你真正需要补的只有两件事:Python 语法(2-3 周搞定)和 LLM 的工作方式(读完第 6 章就够了)。
Java工程师推荐先读:《Java工程师转Python AI开发:跨越指南》 — 这篇文章专门讲Java工程师转Python时的思维转变、可直接复用的优势、以及Python特有的陷阱。读完这篇,再开始第2章Python基础,效率会高很多。
这门课和其他 AI 教程有什么不同
从 0 开始,不跳步骤
很多教程假设你已经懂一些 AI 基础,直接从 LangChain 或 Agent 框架讲起。这门课从 Python 基础开始,每个概念都解释清楚再往下走。
讲原理,不只讲用法
知道怎么用 API 是第一步,知道为什么这样用才能解决问题。每章都会解释背后的原理——不是数学推导,而是"这个机制是怎么工作的"。
代码优先
每个概念都有可以直接运行的代码示例。不是伪代码,是真实可跑的代码。
完整知识体系
课程覆盖从数学基础、传统ML、深度学习,到大模型应用、Agent、微调、MLOps的完整路径。你可以根据自己的目标选择学多深。
不追热点,讲稳定的东西
AI 框架更新很快,但 Token 机制、Prompt 设计原则、RAG 架构、Agent 设计模式——这些核心概念是稳定的,学了不会过时。
课程结构:20 章,从零到生产

图:课程四层技术栈——从基础层(Python/数学/ML)到大模型应用层(API/Prompt/工具调用),再到 Agent 构建层(RAG/LangGraph),最终到工程化层(生产化/微调/MLOps)。
基础层(第1-5章)
| 章节 | 内容 | 适合人群 |
|---|---|---|
| 第1章 AI全景认知 | 传统ML/深度学习/强化学习的认知地图 | 所有人 |
| 第2章 Python基础 | Python语法、asyncio、pydantic | 非Python背景 |
| 第3章 数学基础 | 线代/微积分/概率论,AI必备最少数学 | 想深入AI工程 |
| 第4章 传统机器学习 | sklearn/线性回归/决策树/模型评估 | 想走AI工程师路线 |
| 第5章 深度学习基础 | 神经网络/PyTorch/CNN/Transformer | 想走AI工程师路线 |
大模型应用层(第6-10章)
| 章节 | 内容 | 核心价值 |
|---|---|---|
| 第6章 LLM基础 | Token/Temperature/上下文窗口 | 理解LLM工作原理 |
| 第7章 API入门 | Claude/OpenAI API调用、多轮对话 | 动手起点 |
| 第8章 Prompt工程 | Few-shot/CoT/结构化输出 | 让LLM稳定完成任务 |
| 第9章 工具使用与Function Calling | 工具定义/调用/错误处理 | Agent的核心基础 |
| 第10章 MCP协议 | 工具调用标准协议,Agent生态互联 | 工具集成标准化 |
Agent构建层(第11-15章)
| 章节 | 内容 | 核心价值 |
|---|---|---|
| 第11章 RAG与向量数据库 | 知识库搭建/检索优化 | 企业AI落地最多场景 |
| 第12章 Agent基础 | ReAct/规划/记忆/工具使用 | 自主决策系统 |
| 第13章 LangGraph | 有状态Agent/Human-in-Loop/多Agent | Agent工程化 |
| 第14章 LangChain | 文档处理/Memory/可观测性 | 快速构建LLM应用 |
| 第15章 框架与平台对比 | LangChain/LlamaIndex/AutoGen/Spring AI | 选型决策 |
工程化层(第16-20章)
| 章节 | 内容 | 核心价值 |
|---|---|---|
| 第16章 模型微调 | LoRA/QLoRA/SFT/数据准备 | 定制专属模型 |
| 第17章 MLOps与模型部署 | MLFlow/推理优化/vLLM/Ollama | 模型工程化 |
| 第18章 生产化部署 | 可靠性/成本/安全/监控 | Demo到生产 |
| 第19章 AI伦理与安全 | 公平性/提示注入/合规 | 可信AI系统 |
| 第20章 前沿方向 | Multi-Agent/Agentic RAG/Computer Use | 技术趋势 |
三种学习路径

图:三条学习路径的章节覆盖范围——路径A(蓝,应用开发)覆盖核心章节,路径B(紫,完整路线)覆盖全部20章,路径C(橙,Java快速落地)分两阶段学习。
根据你的目标,选择合适的学习路径。
路径 A:Agent应用开发路线(推荐,约3-4个月)
目标:快速掌握 LLM 应用开发和 Agent 构建,落地实际项目。
不需要:数学基础、传统ML、深度学习(可以跳过第3-5章)
第1章(AI全景认知)
→ 第2章(Python基础)
→ 第6章(LLM基础)
→ 第7章(API入门)
→ 第8章(Prompt工程)
→ 第9章(工具使用与Function Calling)
→ 第10章(MCP协议)
→ 第11章(RAG与向量数据库)
→ 第12章(Agent基础)
→ 第13章(LangGraph)
→ 第18章(生产化部署)
→ 第19章(AI伦理与安全)
适合人群:想快速转型AI应用开发的工程师、产品技术人员、想用AI解决实际问题的开发者。
路径 B:完整AI工程师路线(约12-18个月)
目标:系统掌握AI完整技术栈,具备从应用开发到模型微调、MLOps的全链路能力。
第1章(AI全景认知)→ 第2章(Python基础)→ 第3章 → 第4章 → 第5章(基础层)
→ 第6章 → 第7章 → 第8章 → 第9章 → 第10章(大模型应用层)
→ 第11章 → 第12章 → 第13章 → 第14章 → 第15章(Agent构建层)
→ 第16章 → 第17章 → 第18章 → 第19章 → 第20章(工程化层)
适合人群:想成为AI工程师、算法工程师,或希望深入理解AI技术栈的工程师。
说明:第3-5章(数学基础/传统ML/深度学习)可以和后面的章节并行学习,不需要严格串行。
路径 C:Java工程师快速落地路线(约6-8周)
目标:用 Spring AI 在现有 Java 项目中快速落地 AI 功能,同时并行学习 Python 路线。
第一阶段(工作时间,用 Spring AI 快速落地):
第6章(LLM基础)→ 第7章(API入门)→ 第8章(Prompt工程)
→ 第15章(框架对比,重点看Spring AI部分)→ 第18章(生产化部署)
第二阶段(业余时间,打通Python主流技术栈):
第1章(Python基础)→ 第11章(RAG)→ 第12章(Agent)→ 第13章(LangGraph)
适合人群:有Java开发经验,想在不换语言的情况下快速落地AI功能的工程师。
各章节人群学习建议
不同背景的读者,每章的学习策略不同。下表帮你快速决策:
| 章节 | 初学者 | Java工程师 | 有Python经验 | 想做AI工程师 |
|---|---|---|---|---|
| 第1章 AI全景认知 | ✅ 必读 | ✅ 必读 | ✅ 必读 | ✅ 必读 |
| 第2章 Python基础 | ✅ 必读 | ✅ 必读(重点看第15篇跨越指南) | ⚡ 快速浏览,补缺 | ⚡ 快速浏览 |
| 第3章 数学基础 | ⏭ 可跳过 | ⏭ 可跳过 | ⏭ 可跳过 | ✅ 建议读 |
| 第4章 传统机器学习 | ⏭ 可跳过 | ⏭ 可跳过 | ⏭ 可跳过 | ✅ 建议读 |
| 第5章 深度学习基础 | ⏭ 可跳过 | ⏭ 可跳过 | ⏭ 可跳过 | ✅ 必读 |
| 第6章 LLM基础 | ✅ 必读(01-07篇) | ✅ 必读(01-07篇) | ✅ 必读(01-07篇) | ✅ 全读 |
| 第7章 API入门 | ✅ 必读 | ✅ 必读 | ✅ 必读 | ✅ 必读 |
| 第8章 Prompt工程 | ✅ 必读(01-07篇) | ✅ 必读 | ✅ 必读 | ✅ 全读 |
| 第9章 工具调用 | ✅ 必读 | ✅ 必读 | ✅ 必读 | ✅ 必读 |
| 第10章 MCP协议 | ⚡ 读01篇即可 | ⚡ 读01篇即可 | ⚡ 读01篇即可 | ✅ 全读 |
| 第11章 RAG | ✅ 必读(前5篇) | ✅ 必读(前5篇) | ✅ 必读(前5篇) | ✅ 全读 |
| 第12章 Agent基础 | ✅ 必读(01-09篇) | ✅ 必读(01-09篇) | ✅ 必读(01-09篇) | ✅ 全读 |
| 第13章 LangGraph | ✅ 必读(01-06篇) | ✅ 必读(01-06篇) | ✅ 必读(01-06篇) | ✅ 全读 |
| 第14章 LangChain | ⚡ 选读 | ⚡ 选读 | ⚡ 选读 | ✅ 建议读 |
| 第15章 框架对比 | ⚡ 读01-02篇 | ✅ 必读(含Spring AI篇) | ⚡ 读01-02篇 | ✅ 全读 |
| 第16章 模型微调 | ⏭ 可跳过 | ⏭ 可跳过 | ⏭ 可跳过 | ✅ 必读 |
| 第17章 MLOps | ⏭ 可跳过 | ⚡ 选读 | ⏭ 可跳过 | ✅ 必读 |
| 第18章 生产化部署 | ✅ 必读(01-08篇) | ✅ 必读(01-08篇) | ✅ 必读(01-08篇) | ✅ 全读 |
| 第19章 AI伦理安全 | ⚡ 读01-02篇 | ⚡ 读01-02篇 | ⚡ 读01-02篇 | ✅ 全读 |
| 第20章 前沿方向 | ⚡ 选读 | ⚡ 选读 | ⚡ 选读 | ✅ 建议读 |
图例:✅ 必读 / ⚡ 选读(按需) / ⏭ 可跳过
说明:这张表是建议,不是规定。遇到感兴趣的内容随时深入,遇到暂时用不上的随时跳过。课程的章节设计支持非线性阅读。
实践项目建议
学完对应章节后,建议动手做这些项目:
| 完成章节 | 推荐项目 | 难度 | 关键技术点 |
|---|---|---|---|
| 第6-7章 | 个人AI助手(命令行版) | ⭐ | 多轮对话、消息历史管理、流式输出 |
| 第11章 | 本地文档问答系统 | ⭐⭐ | 文档分块、向量检索、RAG流程 |
| 第12章 | 带工具调用的ReAct Agent | ⭐⭐⭐ | Function Calling、ReAct循环、工具错误处理 |
| 第13章 | 多步骤研究报告生成Agent | ⭐⭐⭐ | LangGraph状态机、Human-in-Loop、流式输出 |
| 第16章 | 微调一个领域专属模型 | ⭐⭐⭐⭐ | LoRA、数据集准备、效果评估 |
| 第18章 | 完整AI服务(含监控、流式输出) | ⭐⭐⭐⭐ | FastAPI、SSE、LangSmith、错误处理、Docker部署 |
Java背景特别适合的项目:
- 代码审查Agent:接入GitHub API,Java代码分析经验直接复用
- 技术要点:Function Calling调用GitHub API、ReAct循环分析代码、结构化输出问题报告
- Text-to-SQL助手:LLM生成SQL,Java数据库经验是优势
- 技术要点:Prompt工程(SQL生成)、结构化输出、数据库连接、结果验证
- 企业内部知识库:RAG + 权限控制,Java后端工程化能力大显身手
- 技术要点:RAG系统、多租户权限控制、FastAPI服务、Docker部署
第一个项目:从第6-7章开始
很多初学者问:学到哪里可以开始做第一个项目?
答案是:学完第6-7章就可以开始。
第一个项目推荐:命令行版个人AI助手(难度⭐)
你只需要会:
- 调用Claude或OpenAI的API
- 维护对话历史(让AI记得上下文)
- 处理用户输入和AI输出
不需要会:RAG、Agent、LangChain……这些都是后面的事。
先把这个简单的项目做出来,跑起来,感受一下"我真的在用AI写程序"——这种感觉会让你更有动力继续学下去。
开始之前:自测你的基础
不需要AI背景,但需要会基础编程。用这个清单快速自测:
✅ 如果你能做到以下3件事,可以直接开始:
- 能写一个Python函数(不需要很复杂,
def add(a, b): return a + b这种就行) - 知道什么是变量、列表、字典
- 能用命令行运行
python hello.py
⚠️ 如果还不会,先补:
- Python入门:推荐《Python编程:从入门到实践》前10章,或者廖雪峰Python教程
- 预计1-2周,然后回来继续
❓ 关于数学:
- 走路径A(Agent应用开发):完全不需要数学,跳过第3-5章
- 走路径B(完整AI工程师):需要高中数学水平(函数、概率基础)
❓ 关于英语:
- 代码里的英文都是常用词,不需要专门学英语
- 遇到不认识的词,翻译软件就够了
快速开始(推荐初学者先做这一步)
第一次接触 AI 开发? 不要被下面的"环境准备"吓到——先看这个:
这份文档会带你一步一步:验证环境 → 获取 DeepSeek API Key → 运行第一个程序 → 看到 AI 回复。
完成后再回来看下面的完整环境配置。
环境准备
# 安装 uv(推荐的 Python 包管理工具)
curl -LsSf https://astral.sh/uv/install.sh | sh
# 创建项目
uv init my-agent-project
cd my-agent-project
# 安装核心依赖
uv add openai langchain langgraph \
python-dotenv pydantic chromadb
# 深度学习相关(路径B需要)
uv add torch torchvision scikit-learn pandas numpy matplotlib
需要准备的 API Key:
- DeepSeek API(主要使用):在 https://platform.deepseek.com 注册获取
- OpenAI API(部分章节使用,主要是 LangChain/LangGraph 相关章节)
关于代码示例中的 API 选择:代码示例主要使用 DeepSeek API(通过 OpenAI 兼容接口),DeepSeek 是国内主流大模型,性价比高且对中文支持好。部分章节(LangChain、LangGraph 等框架)使用 OpenAI API,原因是这些框架的官方文档以 OpenAI 为主,保持一致更容易对照学习。两套 API 的核心概念完全相同,切换只需要替换 client 初始化和 model 参数。
代码版本说明
课程代码基于以下主要包版本编写(2026 年 3 月):
| 包 | 版本 |
|---|---|
openai(DeepSeek/OpenAI 调用) |
≥ 1.50 |
langchain |
≥ 0.3 |
langgraph |
≥ 0.2 |
pydantic |
≥ 2.0 |
python |
≥ 3.11 |
AI 框架迭代很快,遇到代码报错时:
- 先查对应框架的官方文档和 CHANGELOG
- 检查包版本是否符合上表要求(
pip show langchain查看当前版本) - 课程配套代码仓库会持续更新,遇到版本问题可对照仓库代码
一点说明
AI 领域变化很快,框架的具体 API 会随版本更新变化。但本课程重点讲的核心概念——Token 机制、Prompt 设计原则、RAG 架构、Agent 设计模式——这些是稳定的,不会过时。
遇到代码报错,优先查对应框架的官方文档和 CHANGELOG,不要死磕。
课程持续更新。有问题或建议,欢迎评论区留言。
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐



所有评论(0)