零基础学 Agent :收尾——整理你的 Agent 知识地图,规划接下来的路 第 8 期

大家好,我是AI淇橦学。
上期问大家:你把做好的应用给身边的人试用了吗?他在哪里卡住了?
评论区里有几条让我印象很深——有人说用户盯着「客户描述」输入框不知道该写什么,以为要填完整的公司全名;有人说智谱审查报价单时日志滚太快,用户看不清楚发生了什么;还有人说执行完了用户不知道文件在哪里,找了半天……
这些反馈非常真实,也非常有价值。你在自己测试时绝对发现不了这些问题,因为你知道所有答案。真实用户测试的价值就在这里——它告诉你「你以为很明显」但用户根本不知道的地方。
好,今天第8期,这一期不讲新的技术概念。8期做下来,你已经接触了足够多的内容——现在该做的,是把这些内容整理清楚,形成真正属于自己的认知框架,然后规划接下来的路。
一、8期做了什么——完整回顾
先用最简短的方式把8期的核心内容串一遍:
|
期数 |
主题 |
核心内容 |
|---|---|---|
|
第1期 |
基础认知 |
搞清楚 AI / LLM / Chatbot / Workflow / Agent 的区别;明确要做一个桌面端销售报价单 Agent |
|
第2期 |
8模块结构 |
把 Agent 拆成 8 个模块:目标/模型/工具/记忆/规划/执行/反馈/约束;理解每个模块的作用 |
|
第3期 |
工具调用 |
工具调用的底层机制:AI 只发指令,程序去执行;用 Codex 做出了 3 个核心工具:read_file / write_content / save_file;在终端里第一次跑通报价单填写 |
|
第4期 |
大模型接入 + 记忆 |
接入智谱 API,封装 |
|
第5期 |
规划能力 |
智谱批量分析任务、制定执行计划、给出针对性备注;实现批量模式,一次处理多份报价单 |
|
第6期 |
评估与自检 |
两层自检:规则检查字段完整性 + 智谱审查内容合理性;故意制造错误验证拦截效果 |
|
第7期 |
整合与界面 |
把 5 个模块装进 tkinter 桌面应用;后台线程运行智谱调用,界面不卡死;真实用户测试 + MVP 验收 |
|
第8期 |
知识整理(本期) |
整理知识地图;规划后续迭代路径;结束是新的起点 |
二、你真正掌握的,是 5 种能力

8期学了很多概念——RAG、ReAct、Function Calling、智谱 API……但这些技术名词本身不是最重要的收获。最重要的,是你在实际动手过程中练到的 5 种能力。
这 5 种能力不会过时——不管 AI 框架怎么更新、模型怎么迭代,这 5 种能力永远有用:
|
能力 |
具体表现 |
你在哪里练到的 |
|---|---|---|
| 描述能力 |
把你想做的事用清晰准确的自然语言说出来,让 Codex 生成符合要求的代码;给智谱写出有效的 prompt,让它做出你想要的判断 |
每期的「发给 Codex 的提示词」——你每次描述越来越精准;第4-6期给智谱写 prompt 时的反复打磨 |
| 拆解能力 |
把「做一个销售报价单 Agent」这个大目标,拆成 5 个模块、6 个文件、8 步数据流、6 项验收标准 |
第2期结构设计、第5期任务规划、第7期整合检查表 |
| 验收能力 |
知道怎么判断结果是否正确:不只看有没有报错,还要看智谱的判断是否合理、字段有没有错位、原文件有没有被修改 |
第6期的两层自检设计 + 实际故意出错的测试 |
| 调试提问能力 |
出错时提供「具体现象 + 日志 + 初步判断」,让 Codex 快速定位问题,而不是只说「有 bug 帮我修」 |
每期「遇到问题怎么办」里的报错处理经验 |
| 迭代能力 |
从最小可用版本开始,每次只加一个功能,边加边验证,不追求一步到位 |
整个 8 期课程的结构本身——每期只做一件事,做完验证,再进下一期 |
这 5 种能力的本质: 它们是「用 AI 工具做事」的通用能力——不只适用于做报价单 Agent,也适用于用 Codex 做任何项目、给智谱写任何 prompt、用 AI 工具完成任何任务。你在做这个 Agent 的过程中,顺带训练了一套通用的「AI 协作能力」。
坦白说,我觉得这 5 种能力的价值,远大于你学会了具体的某个技术框架。框架会过时,但这套做事方式不会。
三、你的 Agent 知识地图

把8期的核心知识点整理成三个层次。这张地图你可以收藏,之后遇到 Agent 相关的概念,都可以对照这里找到位置:
概念层——是什么
|
知识点 |
一句话理解 |
|---|---|
|
AI / LLM / Chatbot / Workflow / Agent |
Agent = AI 大脑 + 工具 + 自主规划,能真正帮你做事,不只是告诉你答案 |
|
上下文窗口 |
AI 的「工作桌面」有大小限制,超出就丢弃最早的内容;对话结束桌面清空,这就是 AI 没有记忆的本质 |
|
智谱 API |
通过 HTTP 请求调用智谱模型的接口; |
|
Token 和费用 |
约 1 个汉字 = 1.5 个 Token;处理一份报价单约消耗 500-800 Token |
机制层——怎么做到的
|
知识点 |
一句话理解 |
|---|---|
|
工具调用 / Function Calling |
AI 只发指令,程序去真正执行,结果再返回 AI;AI 从头到尾只处理文字 |
|
RAG 5步流程 |
切片→向量化→存库→检索→生成;让 AI 基于你的真实文档工作,而不是靠猜 |
|
智谱语义搜索 |
把客户列表和搜索描述一起发给智谱,智谱理解语义并返回最匹配的客户;比 TF-IDF 更灵活,能处理「南山区那家」这种模糊描述 |
|
Plan-and-Execute |
先让智谱把所有步骤规划出来、你确认、再按顺序执行;适合批量处理等步骤固定的场景 |
|
ReAct 循环 |
思考→行动→观察→继续,每步根据实际结果决定下一步;适合处理格式不固定的复杂任务 |
实践层——怎么用好
|
知识点 |
一句话理解 |
|---|---|
|
工具设计三原则 |
单一职责 + 描述清晰 + 返回易读;工具描述写清楚,智谱调用出错的概率大幅降低 |
|
给智谱写 prompt 的关键 |
说清楚角色、输入、输出格式、边界约束;要 JSON 就明确说「只返回 JSON,不要任何其他文字」 |
|
目标漂移防范 |
描述加边界(不能做什么)+ 执行前展示计划 + 批量操作加预览确认 |
|
两层自检设计 |
规则检查快速过滤明显问题(不消耗 API),智谱审查处理规则覆盖不到的语义问题 |
|
调试三要素 |
具体现象 + 相关日志 + 初步判断;这三个信息给全,Codex 能直接定位问题 |
|
线程与界面 |
智谱 API 调用放在后台线程,用 queue 传递消息更新界面,界面才不会卡死 |
四、接下来 3 个月的规划

8期结束,但迭代没有结束。根据大家在评论区提到的真实需求,这是一个可参考的 3 个月规划:
第 1 个月:让它真正融入日常工作
目标:把这个 Agent 变成你日常出报价单的默认工具,在真实工作中用起来。
具体做法:
-
把你真实的客户资料都录入
客户资料.json,不要只用示例数据 -
每次出报价单都用这个程序,记录遇到的问题(智谱匹配错了?字段没填上?界面哪里不顺手?)
-
集中修复最影响日常使用的 3 个问题——用 Codex 解决,每次修复完验证一遍
完成标志:连续用 2 周,没有出现需要手动纠正的错误。
第 2 个月:扩展一个真正需要的功能
目标:根据第 1 个月的真实使用,找到最痛的一个点,加一个新功能。
高频需求参考(选一个,每次只加一个):
|
需求 |
难度 |
怎么加 |
|---|---|---|
|
支持 PDF 格式的报价单 |
⭐⭐ |
安装 |
|
生成完报价单后自动发邮件 |
⭐⭐⭐ |
用 Python 的 |
|
支持从 Excel 表格批量导入客户 |
⭐⭐ |
用 |
|
报价单生成后自动保存到指定云端文件夹 |
⭐⭐⭐ |
接入云盘 API |
每次只加一个,加完在真实场景里测试稳定了,再考虑加下一个。
第 3 个月:沉淀方法,准备做第二个 Agent
目标:把这 8 期学到的方法沉淀成可复用的资产,开始规划第二个 Agent。
具体做法:
-
整理你自己的提示词模板库:把每期「发给 Codex 的提示词」里有效的部分存成文档,下次做新项目直接复用
-
把
llm.py整理成通用模块:它不只适用于报价单场景,任何需要调用智谱的项目都可以复用 -
规划第二个 Agent:用同样的方法论——先想清楚「输入是什么、输出是什么、智谱在哪几个环节做判断」,再动手
第 3 个月最重要的事:做第二个 Agent。
第一个 Agent 是学习的过程,第二个才是验证的过程——验证你是不是真的掌握了这套方法论,而不只是跟着课程走了一遍。第二个 Agent,从立项到跑通的速度,应该比第一个快至少一倍。如果没有快,说明有什么东西还没真正内化,值得回头再想一遍。
五、给整个系列一个句号

我想用一句话来总结这 8 期:
做 Agent 最核心的不是写代码,是把你想做什么说清楚——说给 Codex,说给智谱,说给自己。
你把目标说清楚了,Codex 能帮你写代码;你把任务说清楚了,智谱能帮你做判断;你连自己都没想清楚,再好的工具也帮不了你。这不是 AI 的限制,这是「思考」本身的价值。
这 8 期的价值,不只是你学会了 RAG 或者智谱 API,而是你练了一遍「怎么把一个模糊的想法,一步步变成一个可以真实运行的、有 AI 大脑的产品」。
从第3期第一次在终端里看到报价单被自动填好,到第7期把整个系统装进一个窗口应用,交给不懂技术的人也能用——这个过程里你不只是在「学 Agent」,你是在练一种工作方式:把问题拆清楚,用对工具,一步一步验证,不追求一步到位。
这种工作方式,在 AI 时代会越来越重要。
系列结束了,但不是全部结束。
我会继续更新——记录我怎么迭代这个报价单 Agent,加入邮件发送、PDF 支持,以及我开始做第二个 Agent 的全过程。
关注我,我们继续。
思考题: 8期学下来,你最有收获的是什么?是某个具体的技术,还是这套工作方式?评论告诉我。
关注公众号「AI淇橦学」,和 AI 一起成长。
有问题或建议?后台留言即可。
后台回复“Agent”,领取课程讲义。
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐

所有评论(0)