零基础学 Agent ：收尾——整理你的 Agent 知识地图，规划接下来的路第 8 期

AI淇橦学

379人浏览 · 2026-03-25 21:55:42

AI淇橦学 · 2026-03-25 21:55:42 发布

大家好，我是AI淇橦学。

上期问大家：你把做好的应用给身边的人试用了吗？他在哪里卡住了？

评论区里有几条让我印象很深——有人说用户盯着「客户描述」输入框不知道该写什么，以为要填完整的公司全名；有人说智谱审查报价单时日志滚太快，用户看不清楚发生了什么；还有人说执行完了用户不知道文件在哪里，找了半天……

这些反馈非常真实，也非常有价值。你在自己测试时绝对发现不了这些问题，因为你知道所有答案。真实用户测试的价值就在这里——它告诉你「你以为很明显」但用户根本不知道的地方。

好，今天第8期，这一期不讲新的技术概念。8期做下来，你已经接触了足够多的内容——现在该做的，是把这些内容整理清楚，形成真正属于自己的认知框架，然后规划接下来的路。

一、8期做了什么——完整回顾

先用最简短的方式把8期的核心内容串一遍：

期数	主题	核心内容
第1期	基础认知	搞清楚 AI / LLM / Chatbot / Workflow / Agent 的区别；明确要做一个桌面端销售报价单 Agent
第2期	8模块结构	把 Agent 拆成 8 个模块：目标/模型/工具/记忆/规划/执行/反馈/约束；理解每个模块的作用
第3期	工具调用	工具调用的底层机制：AI 只发指令，程序去执行；用 Codex 做出了 3 个核心工具：read_file / write_content / save_file；在终端里第一次跑通报价单填写
第4期	大模型接入 + 记忆	接入智谱 API，封装 `llm.py`；建立客户知识库，智谱做语义搜索，输入「南山区那家传感器公司」能找到正确客户
第5期	规划能力	智谱批量分析任务、制定执行计划、给出针对性备注；实现批量模式，一次处理多份报价单
第6期	评估与自检	两层自检：规则检查字段完整性 + 智谱审查内容合理性；故意制造错误验证拦截效果
第7期	整合与界面	把 5 个模块装进 tkinter 桌面应用；后台线程运行智谱调用，界面不卡死；真实用户测试 + MVP 验收
第8期	知识整理（本期）	整理知识地图；规划后续迭代路径；结束是新的起点

二、你真正掌握的，是 5 种能力

8期学了很多概念——RAG、ReAct、Function Calling、智谱 API……但这些技术名词本身不是最重要的收获。最重要的，是你在实际动手过程中练到的 5 种能力。

这 5 种能力不会过时——不管 AI 框架怎么更新、模型怎么迭代，这 5 种能力永远有用：

能力	具体表现	你在哪里练到的
描述能力	把你想做的事用清晰准确的自然语言说出来，让 Codex 生成符合要求的代码；给智谱写出有效的 prompt，让它做出你想要的判断	每期的「发给 Codex 的提示词」——你每次描述越来越精准；第4-6期给智谱写 prompt 时的反复打磨
拆解能力	把「做一个销售报价单 Agent」这个大目标，拆成 5 个模块、6 个文件、8 步数据流、6 项验收标准	第2期结构设计、第5期任务规划、第7期整合检查表
验收能力	知道怎么判断结果是否正确：不只看有没有报错，还要看智谱的判断是否合理、字段有没有错位、原文件有没有被修改	第6期的两层自检设计 + 实际故意出错的测试
调试提问能力	出错时提供「具体现象 + 日志 + 初步判断」，让 Codex 快速定位问题，而不是只说「有 bug 帮我修」	每期「遇到问题怎么办」里的报错处理经验
迭代能力	从最小可用版本开始，每次只加一个功能，边加边验证，不追求一步到位	整个 8 期课程的结构本身——每期只做一件事，做完验证，再进下一期

这 5 种能力的本质： 它们是「用 AI 工具做事」的通用能力——不只适用于做报价单 Agent，也适用于用 Codex 做任何项目、给智谱写任何 prompt、用 AI 工具完成任何任务。你在做这个 Agent 的过程中，顺带训练了一套通用的「AI 协作能力」。

坦白说，我觉得这 5 种能力的价值，远大于你学会了具体的某个技术框架。框架会过时，但这套做事方式不会。

三、你的 Agent 知识地图

把8期的核心知识点整理成三个层次。这张地图你可以收藏，之后遇到 Agent 相关的概念，都可以对照这里找到位置：

概念层——是什么

知识点	一句话理解
AI / LLM / Chatbot / Workflow / Agent	Agent = AI 大脑 + 工具 + 自主规划，能真正帮你做事，不只是告诉你答案
上下文窗口	AI 的「工作桌面」有大小限制，超出就丢弃最早的内容；对话结束桌面清空，这就是 AI 没有记忆的本质
智谱 API	通过 HTTP 请求调用智谱模型的接口；`ask_zhipu()` 发指令，`ask_zhipu_json()` 要求返回结构化数据
Token 和费用	约 1 个汉字 = 1.5 个 Token；处理一份报价单约消耗 500-800 Token

机制层——怎么做到的

知识点	一句话理解
工具调用 / Function Calling	AI 只发指令，程序去真正执行，结果再返回 AI；AI 从头到尾只处理文字
RAG 5步流程	切片→向量化→存库→检索→生成；让 AI 基于你的真实文档工作，而不是靠猜
智谱语义搜索	把客户列表和搜索描述一起发给智谱，智谱理解语义并返回最匹配的客户；比 TF-IDF 更灵活，能处理「南山区那家」这种模糊描述
Plan-and-Execute	先让智谱把所有步骤规划出来、你确认、再按顺序执行；适合批量处理等步骤固定的场景
ReAct 循环	思考→行动→观察→继续，每步根据实际结果决定下一步；适合处理格式不固定的复杂任务

实践层——怎么用好

知识点	一句话理解
工具设计三原则	单一职责 + 描述清晰 + 返回易读；工具描述写清楚，智谱调用出错的概率大幅降低
给智谱写 prompt 的关键	说清楚角色、输入、输出格式、边界约束；要 JSON 就明确说「只返回 JSON，不要任何其他文字」
目标漂移防范	描述加边界（不能做什么）+ 执行前展示计划 + 批量操作加预览确认
两层自检设计	规则检查快速过滤明显问题（不消耗 API），智谱审查处理规则覆盖不到的语义问题
调试三要素	具体现象 + 相关日志 + 初步判断；这三个信息给全，Codex 能直接定位问题
线程与界面	智谱 API 调用放在后台线程，用 queue 传递消息更新界面，界面才不会卡死

四、接下来 3 个月的规划

8期结束，但迭代没有结束。根据大家在评论区提到的真实需求，这是一个可参考的 3 个月规划：

第 1 个月：让它真正融入日常工作

目标：把这个 Agent 变成你日常出报价单的默认工具，在真实工作中用起来。

具体做法：

把你真实的客户资料都录入 客户资料.json，不要只用示例数据
每次出报价单都用这个程序，记录遇到的问题（智谱匹配错了？字段没填上？界面哪里不顺手？）
集中修复最影响日常使用的 3 个问题——用 Codex 解决，每次修复完验证一遍

完成标志：连续用 2 周，没有出现需要手动纠正的错误。

第 2 个月：扩展一个真正需要的功能

目标：根据第 1 个月的真实使用，找到最痛的一个点，加一个新功能。

高频需求参考（选一个，每次只加一个）：

需求	难度	怎么加
支持 PDF 格式的报价单	⭐⭐	安装 `pdfplumber` 库，新增 `read_pdf` 工具函数
生成完报价单后自动发邮件	⭐⭐⭐	用 Python 的 `smtplib` 库，让智谱生成邮件正文，附上报价单文件
支持从 Excel 表格批量导入客户	⭐⭐	用 `openpyxl` 读取 Excel，转成 `客户资料.json` 的格式导入
报价单生成后自动保存到指定云端文件夹	⭐⭐⭐	接入云盘 API

每次只加一个，加完在真实场景里测试稳定了，再考虑加下一个。

第 3 个月：沉淀方法，准备做第二个 Agent

目标：把这 8 期学到的方法沉淀成可复用的资产，开始规划第二个 Agent。

具体做法：

整理你自己的提示词模板库：把每期「发给 Codex 的提示词」里有效的部分存成文档，下次做新项目直接复用
把 llm.py 整理成通用模块：它不只适用于报价单场景，任何需要调用智谱的项目都可以复用
规划第二个 Agent：用同样的方法论——先想清楚「输入是什么、输出是什么、智谱在哪几个环节做判断」，再动手

第 3 个月最重要的事：做第二个 Agent。

第一个 Agent 是学习的过程，第二个才是验证的过程——验证你是不是真的掌握了这套方法论，而不只是跟着课程走了一遍。第二个 Agent，从立项到跑通的速度，应该比第一个快至少一倍。如果没有快，说明有什么东西还没真正内化，值得回头再想一遍。

五、给整个系列一个句号

我想用一句话来总结这 8 期：

做 Agent 最核心的不是写代码，是把你想做什么说清楚——说给 Codex，说给智谱，说给自己。

你把目标说清楚了，Codex 能帮你写代码；你把任务说清楚了，智谱能帮你做判断；你连自己都没想清楚，再好的工具也帮不了你。这不是 AI 的限制，这是「思考」本身的价值。

这 8 期的价值，不只是你学会了 RAG 或者智谱 API，而是你练了一遍「怎么把一个模糊的想法，一步步变成一个可以真实运行的、有 AI 大脑的产品」。

从第3期第一次在终端里看到报价单被自动填好，到第7期把整个系统装进一个窗口应用，交给不懂技术的人也能用——这个过程里你不只是在「学 Agent」，你是在练一种工作方式：把问题拆清楚，用对工具，一步一步验证，不追求一步到位。

这种工作方式，在 AI 时代会越来越重要。

系列结束了，但不是全部结束。

我会继续更新——记录我怎么迭代这个报价单 Agent，加入邮件发送、PDF 支持，以及我开始做第二个 Agent 的全过程。

关注我，我们继续。

思考题： 8期学下来，你最有收获的是什么？是某个具体的技术，还是这套工作方式？评论告诉我。

关注公众号「AI淇橦学」，和 AI 一起成长。

有问题或建议？后台留言即可。

后台回复“Agent”，领取课程讲义。

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

C语言的认识：入门

printf:使用时必须要使用#include<stdio.h>，即：阐述了C语言的头文件依赖。简单说就是：在使用任何标准库函数之前，都必须包含相应的头文件。C语言是面向过程的底层语言，遵循“头文件+main主函数+功能语句”的固定框架，在后续学习中将会沿着这七个阶段循序渐进的学习。存储单位：Bit->Byte->KB->MB->GB->TB。换而言之即：自己语言所表达的意思，计算机能听懂语言是什

AtomGit开源社区

基于PLC的恒压供水控制系统西门子s7-1200变频恒压供水系统程序(设计源文件+万字报告+讲解)（支持资料、图片参考_降重降ai）

基于PLC的恒压供水控制系统西门子s7-1200变频恒压供水系统程序(设计源文件+万字报告+讲解)（支持资料、图片参考_降重降ai）5.带万字配套报告(恒压供水设计文档word版/pdf版)博途v16及其以上可打开。3.有图纸(I/O表主电路控制电路图CAD图纸dwg格式，以及总体程序流程图)1.有动态过程画面仿真和梯形图程序。4.程序打开运行视频。