从零开始：0基础 Agent 开发课

菅志平

216人浏览 · 2026-03-25 14:07:36

菅志平 · 2026-03-25 14:07:36 发布

从零开始：0基础 Agent 开发课

写于 2026 年 3 月
面向对象：完全没有 AI 开发经验的程序员，或Java开发、Python、前端开发想转到AI开发的程序员们。

先说结论

这门课能让你从零开始，系统掌握 AI 开发的完整技术栈——从数学基础、传统机器学习、深度学习，到大模型应用开发、Agent 构建、模型微调、生产化部署。

不需要有 AI 背景。需要的只是：会写代码。

你可能有这样的困惑

2022 年底 ChatGPT 出来之后，身边越来越多的人在做 AI 相关的东西。但你打开那些教程，要么是一堆数学公式，要么上来就是各种框架名词——LangChain、LangGraph、RAG、Agent——根本不知道从哪里入手。

或者你已经会调 API 了，但一到真实项目就卡住：

为什么换了几个词，模型输出质量就天差地别？
Agent 跑起来了，但一直在绕圈子，不知道怎么调？
RAG 知识库搭好了，检索出来的内容驴唇不对马嘴，怎么办？
Demo 效果挺好，一上生产各种崩，问题出在哪？

这些问题靠"多试几次"解决不了。需要的是系统性的理解——从 LLM 工作原理，到 Prompt 设计，到 Agent 架构，到生产化工程。

这门课就是为了解决这个问题而设计的。

学完这门课，你能做到什么

按学习进度，你会依次获得这些能力：

学完第6-7章（约2周）→ 能做：命令行版个人 AI 助手
调用 DeepSeek API，维护对话历史，让 AI 记住你说过的话。这是第一个真实可用的项目。

学完第8章（约1周）→ 能做：稳定输出你想要格式的 AI
不再靠运气，学会用 Few-shot、CoT、结构化输出让模型按你的要求输出，成功率从 60% 提升到 95%+。

学完第11章（约2周）→ 能做：自己公司文档的智能问答系统
把 PDF、Word、网页变成可查询的知识库。问"上季度销售额是多少"，AI 直接从你的文档里找答案。

学完第12章（约2周）→ 能做：能自主完成多步骤任务的 Agent
不只是回答问题，而是能搜索资料、调用工具、写代码、执行任务——自动完成需要多步操作的工作。

学完第18章（约1周）→ 能做：把 AI 功能上线到真实服务
不只是 Demo，而是有错误处理、成本控制、监控告警的生产级 AI 服务。

给有经验的工程师：如果你已经有项目经验，想解决具体问题，直接跳到对应章节：

Agent 绕圈子停不下来 → 第12章 ReAct 终止条件 + 第13章 LangGraph 状态机

RAG 检索内容不相关 → 第11章文档分块策略、混合检索、重排序

Demo 上生产就崩 → 第18章错误处理、重试策略、成本控制

工具调用格式错误 → 第9章 Function Calling + 第12章 Agent 调试指南

Java 工程师，你的优势比你想象的大

很多 Java 开发者觉得转 AI 要从头开始，其实不是。

你已经有的东西，在 AI 工程化阶段直接用得上：

系统设计能力：Agent 系统本质上是一个分布式异步系统。你熟悉的微服务架构、消息队列、数据库设计，在 AI 应用的生产化阶段都是核心竞争力。

工程化意识：Java 生态的测试规范、CI/CD 流程、可观测性体系，大多数 Python AI 开发者反而不重视这些。你的工程化习惯是优势，不是负担。

API 设计经验：Function Calling 的本质是给 LLM 定义函数接口。你写了多年的 API 设计经验，在工具定义上直接复用。

数据库和 SQL 经验：RAG 系统的向量数据库、Text-to-SQL 应用——这些对你来说比对纯 Python 开发者上手快得多。

你真正需要补的只有两件事：Python 语法（2-3 周搞定）和 LLM 的工作方式（读完第 6 章就够了）。

Java工程师推荐先读：《Java工程师转Python AI开发：跨越指南》 — 这篇文章专门讲Java工程师转Python时的思维转变、可直接复用的优势、以及Python特有的陷阱。读完这篇，再开始第2章Python基础，效率会高很多。

这门课和其他 AI 教程有什么不同

从 0 开始，不跳步骤

很多教程假设你已经懂一些 AI 基础，直接从 LangChain 或 Agent 框架讲起。这门课从 Python 基础开始，每个概念都解释清楚再往下走。

讲原理，不只讲用法

知道怎么用 API 是第一步，知道为什么这样用才能解决问题。每章都会解释背后的原理——不是数学推导，而是"这个机制是怎么工作的"。

代码优先

每个概念都有可以直接运行的代码示例。不是伪代码，是真实可跑的代码。

完整知识体系

课程覆盖从数学基础、传统ML、深度学习，到大模型应用、Agent、微调、MLOps的完整路径。你可以根据自己的目标选择学多深。

不追热点，讲稳定的东西

AI 框架更新很快，但 Token 机制、Prompt 设计原则、RAG 架构、Agent 设计模式——这些核心概念是稳定的，学了不会过时。

课程结构：20 章，从零到生产

在这里插入图片描述

图：课程四层技术栈——从基础层（Python/数学/ML）到大模型应用层（API/Prompt/工具调用），再到 Agent 构建层（RAG/LangGraph），最终到工程化层（生产化/微调/MLOps）。

基础层（第1-5章）

章节	内容	适合人群
第1章 AI全景认知	传统ML/深度学习/强化学习的认知地图	所有人
第2章 Python基础	Python语法、asyncio、pydantic	非Python背景
第3章数学基础	线代/微积分/概率论，AI必备最少数学	想深入AI工程
第4章传统机器学习	sklearn/线性回归/决策树/模型评估	想走AI工程师路线
第5章深度学习基础	神经网络/PyTorch/CNN/Transformer	想走AI工程师路线

大模型应用层（第6-10章）

章节	内容	核心价值
第6章 LLM基础	Token/Temperature/上下文窗口	理解LLM工作原理
第7章 API入门	Claude/OpenAI API调用、多轮对话	动手起点
第8章 Prompt工程	Few-shot/CoT/结构化输出	让LLM稳定完成任务
第9章工具使用与Function Calling	工具定义/调用/错误处理	Agent的核心基础
第10章 MCP协议	工具调用标准协议，Agent生态互联	工具集成标准化

Agent构建层（第11-15章）

章节	内容	核心价值
第11章 RAG与向量数据库	知识库搭建/检索优化	企业AI落地最多场景
第12章 Agent基础	ReAct/规划/记忆/工具使用	自主决策系统
第13章 LangGraph	有状态Agent/Human-in-Loop/多Agent	Agent工程化
第14章 LangChain	文档处理/Memory/可观测性	快速构建LLM应用
第15章框架与平台对比	LangChain/LlamaIndex/AutoGen/Spring AI	选型决策

工程化层（第16-20章）

章节	内容	核心价值
第16章模型微调	LoRA/QLoRA/SFT/数据准备	定制专属模型
第17章 MLOps与模型部署	MLFlow/推理优化/vLLM/Ollama	模型工程化
第18章生产化部署	可靠性/成本/安全/监控	Demo到生产
第19章 AI伦理与安全	公平性/提示注入/合规	可信AI系统
第20章前沿方向	Multi-Agent/Agentic RAG/Computer Use	技术趋势

三种学习路径

在这里插入图片描述

图：三条学习路径的章节覆盖范围——路径A（蓝，应用开发）覆盖核心章节，路径B（紫，完整路线）覆盖全部20章，路径C（橙，Java快速落地）分两阶段学习。

根据你的目标，选择合适的学习路径。

路径 A：Agent应用开发路线（推荐，约3-4个月）

目标：快速掌握 LLM 应用开发和 Agent 构建，落地实际项目。

不需要：数学基础、传统ML、深度学习（可以跳过第3-5章）

第1章（AI全景认知）
→ 第2章（Python基础）
→ 第6章（LLM基础）
→ 第7章（API入门）
→ 第8章（Prompt工程）
→ 第9章（工具使用与Function Calling）
→ 第10章（MCP协议）
→ 第11章（RAG与向量数据库）
→ 第12章（Agent基础）
→ 第13章（LangGraph）
→ 第18章（生产化部署）
→ 第19章（AI伦理与安全）

适合人群：想快速转型AI应用开发的工程师、产品技术人员、想用AI解决实际问题的开发者。

路径 B：完整AI工程师路线（约12-18个月）

目标：系统掌握AI完整技术栈，具备从应用开发到模型微调、MLOps的全链路能力。

第1章（AI全景认知）→ 第2章（Python基础）→ 第3章 → 第4章 → 第5章（基础层）
→ 第6章 → 第7章 → 第8章 → 第9章 → 第10章（大模型应用层）
→ 第11章 → 第12章 → 第13章 → 第14章 → 第15章（Agent构建层）
→ 第16章 → 第17章 → 第18章 → 第19章 → 第20章（工程化层）

适合人群：想成为AI工程师、算法工程师，或希望深入理解AI技术栈的工程师。

说明：第3-5章（数学基础/传统ML/深度学习）可以和后面的章节并行学习，不需要严格串行。

路径 C：Java工程师快速落地路线（约6-8周）

目标：用 Spring AI 在现有 Java 项目中快速落地 AI 功能，同时并行学习 Python 路线。

第一阶段（工作时间，用 Spring AI 快速落地）：

第6章（LLM基础）→ 第7章（API入门）→ 第8章（Prompt工程）
→ 第15章（框架对比，重点看Spring AI部分）→ 第18章（生产化部署）

第二阶段（业余时间，打通Python主流技术栈）：

第1章（Python基础）→ 第11章（RAG）→ 第12章（Agent）→ 第13章（LangGraph）

适合人群：有Java开发经验，想在不换语言的情况下快速落地AI功能的工程师。

各章节人群学习建议

不同背景的读者，每章的学习策略不同。下表帮你快速决策：

章节	初学者	Java工程师	有Python经验	想做AI工程师
第1章 AI全景认知	✅ 必读	✅ 必读	✅ 必读	✅ 必读
第2章 Python基础	✅ 必读	✅ 必读（重点看第15篇跨越指南）	⚡ 快速浏览，补缺	⚡ 快速浏览
第3章数学基础	⏭ 可跳过	⏭ 可跳过	⏭ 可跳过	✅ 建议读
第4章传统机器学习	⏭ 可跳过	⏭ 可跳过	⏭ 可跳过	✅ 建议读
第5章深度学习基础	⏭ 可跳过	⏭ 可跳过	⏭ 可跳过	✅ 必读
第6章 LLM基础	✅ 必读（01-07篇）	✅ 必读（01-07篇）	✅ 必读（01-07篇）	✅ 全读
第7章 API入门	✅ 必读	✅ 必读	✅ 必读	✅ 必读
第8章 Prompt工程	✅ 必读（01-07篇）	✅ 必读	✅ 必读	✅ 全读
第9章工具调用	✅ 必读	✅ 必读	✅ 必读	✅ 必读
第10章 MCP协议	⚡ 读01篇即可	⚡ 读01篇即可	⚡ 读01篇即可	✅ 全读
第11章 RAG	✅ 必读（前5篇）	✅ 必读（前5篇）	✅ 必读（前5篇）	✅ 全读
第12章 Agent基础	✅ 必读（01-09篇）	✅ 必读（01-09篇）	✅ 必读（01-09篇）	✅ 全读
第13章 LangGraph	✅ 必读（01-06篇）	✅ 必读（01-06篇）	✅ 必读（01-06篇）	✅ 全读
第14章 LangChain	⚡ 选读	⚡ 选读	⚡ 选读	✅ 建议读
第15章框架对比	⚡ 读01-02篇	✅ 必读（含Spring AI篇）	⚡ 读01-02篇	✅ 全读
第16章模型微调	⏭ 可跳过	⏭ 可跳过	⏭ 可跳过	✅ 必读
第17章 MLOps	⏭ 可跳过	⚡ 选读	⏭ 可跳过	✅ 必读
第18章生产化部署	✅ 必读（01-08篇）	✅ 必读（01-08篇）	✅ 必读（01-08篇）	✅ 全读
第19章 AI伦理安全	⚡ 读01-02篇	⚡ 读01-02篇	⚡ 读01-02篇	✅ 全读
第20章前沿方向	⚡ 选读	⚡ 选读	⚡ 选读	✅ 建议读

图例：✅ 必读 / ⚡ 选读（按需） / ⏭ 可跳过

说明：这张表是建议，不是规定。遇到感兴趣的内容随时深入，遇到暂时用不上的随时跳过。课程的章节设计支持非线性阅读。

实践项目建议

学完对应章节后，建议动手做这些项目：

完成章节	推荐项目	难度	关键技术点
第6-7章	个人AI助手（命令行版）	⭐	多轮对话、消息历史管理、流式输出
第11章	本地文档问答系统	⭐⭐	文档分块、向量检索、RAG流程
第12章	带工具调用的ReAct Agent	⭐⭐⭐	Function Calling、ReAct循环、工具错误处理
第13章	多步骤研究报告生成Agent	⭐⭐⭐	LangGraph状态机、Human-in-Loop、流式输出
第16章	微调一个领域专属模型	⭐⭐⭐⭐	LoRA、数据集准备、效果评估
第18章	完整AI服务（含监控、流式输出）	⭐⭐⭐⭐	FastAPI、SSE、LangSmith、错误处理、Docker部署

Java背景特别适合的项目：

代码审查Agent：接入GitHub API，Java代码分析经验直接复用
- 技术要点：Function Calling调用GitHub API、ReAct循环分析代码、结构化输出问题报告
Text-to-SQL助手：LLM生成SQL，Java数据库经验是优势
- 技术要点：Prompt工程（SQL生成）、结构化输出、数据库连接、结果验证
企业内部知识库：RAG + 权限控制，Java后端工程化能力大显身手
- 技术要点：RAG系统、多租户权限控制、FastAPI服务、Docker部署

第一个项目：从第6-7章开始

很多初学者问：学到哪里可以开始做第一个项目？

答案是：学完第6-7章就可以开始。

第一个项目推荐：命令行版个人AI助手（难度⭐）

你只需要会：

调用Claude或OpenAI的API
维护对话历史（让AI记得上下文）
处理用户输入和AI输出

不需要会：RAG、Agent、LangChain……这些都是后面的事。

先把这个简单的项目做出来，跑起来，感受一下"我真的在用AI写程序"——这种感觉会让你更有动力继续学下去。

开始之前：自测你的基础

不需要AI背景，但需要会基础编程。用这个清单快速自测：

✅ 如果你能做到以下3件事，可以直接开始：

能写一个Python函数（不需要很复杂，def add(a, b): return a + b 这种就行）
知道什么是变量、列表、字典
能用命令行运行 python hello.py

⚠️ 如果还不会，先补：

Python入门：推荐《Python编程：从入门到实践》前10章，或者廖雪峰Python教程
预计1-2周，然后回来继续

❓ 关于数学：

走路径A（Agent应用开发）：完全不需要数学，跳过第3-5章
走路径B（完整AI工程师）：需要高中数学水平（函数、概率基础）

❓ 关于英语：

代码里的英文都是常用词，不需要专门学英语
遇到不认识的词，翻译软件就够了

快速开始（推荐初学者先做这一步）

第一次接触 AI 开发？ 不要被下面的"环境准备"吓到——先看这个：

→ 15分钟快速入门：跑通你的第一个 AI 程序

这份文档会带你一步一步：验证环境 → 获取 DeepSeek API Key → 运行第一个程序 → 看到 AI 回复。
完成后再回来看下面的完整环境配置。

环境准备

# 安装 uv（推荐的 Python 包管理工具）
curl -LsSf https://astral.sh/uv/install.sh | sh

# 创建项目
uv init my-agent-project
cd my-agent-project

# 安装核心依赖
uv add openai langchain langgraph \
       python-dotenv pydantic chromadb

# 深度学习相关（路径B需要）
uv add torch torchvision scikit-learn pandas numpy matplotlib

需要准备的 API Key：

DeepSeek API（主要使用）：在 https://platform.deepseek.com 注册获取
OpenAI API（部分章节使用，主要是 LangChain/LangGraph 相关章节）

关于代码示例中的 API 选择：代码示例主要使用 DeepSeek API（通过 OpenAI 兼容接口），DeepSeek 是国内主流大模型，性价比高且对中文支持好。部分章节（LangChain、LangGraph 等框架）使用 OpenAI API，原因是这些框架的官方文档以 OpenAI 为主，保持一致更容易对照学习。两套 API 的核心概念完全相同，切换只需要替换 client 初始化和 model 参数。