图片


大家好,我是AI淇橦学。

上期问大家:你把做好的应用给身边的人试用了吗?他在哪里卡住了?

评论区里有几条让我印象很深——有人说用户盯着「客户描述」输入框不知道该写什么,以为要填完整的公司全名;有人说智谱审查报价单时日志滚太快,用户看不清楚发生了什么;还有人说执行完了用户不知道文件在哪里,找了半天……

这些反馈非常真实,也非常有价值。你在自己测试时绝对发现不了这些问题,因为你知道所有答案。真实用户测试的价值就在这里——它告诉你「你以为很明显」但用户根本不知道的地方。

好,今天第8期,这一期不讲新的技术概念。8期做下来,你已经接触了足够多的内容——现在该做的,是把这些内容整理清楚,形成真正属于自己的认知框架,然后规划接下来的路。


一、8期做了什么——完整回顾

先用最简短的方式把8期的核心内容串一遍:

期数

主题

核心内容

第1期

基础认知

搞清楚 AI / LLM / Chatbot / Workflow / Agent 的区别;明确要做一个桌面端销售报价单 Agent

第2期

8模块结构

把 Agent 拆成 8 个模块:目标/模型/工具/记忆/规划/执行/反馈/约束;理解每个模块的作用

第3期

工具调用

工具调用的底层机制:AI 只发指令,程序去执行;用 Codex 做出了 3 个核心工具:read_file / write_content / save_file;在终端里第一次跑通报价单填写

第4期

大模型接入 + 记忆

接入智谱 API,封装 llm.py;建立客户知识库,智谱做语义搜索,输入「南山区那家传感器公司」能找到正确客户

第5期

规划能力

智谱批量分析任务、制定执行计划、给出针对性备注;实现批量模式,一次处理多份报价单

第6期

评估与自检

两层自检:规则检查字段完整性 + 智谱审查内容合理性;故意制造错误验证拦截效果

第7期

整合与界面

把 5 个模块装进 tkinter 桌面应用;后台线程运行智谱调用,界面不卡死;真实用户测试 + MVP 验收

第8期

知识整理(本期)

整理知识地图;规划后续迭代路径;结束是新的起点


二、你真正掌握的,是 5 种能力

图片

8期学了很多概念——RAG、ReAct、Function Calling、智谱 API……但这些技术名词本身不是最重要的收获。最重要的,是你在实际动手过程中练到的 5 种能力。

这 5 种能力不会过时——不管 AI 框架怎么更新、模型怎么迭代,这 5 种能力永远有用:

能力

具体表现

你在哪里练到的

描述能力

把你想做的事用清晰准确的自然语言说出来,让 Codex 生成符合要求的代码;给智谱写出有效的 prompt,让它做出你想要的判断

每期的「发给 Codex 的提示词」——你每次描述越来越精准;第4-6期给智谱写 prompt 时的反复打磨

拆解能力

把「做一个销售报价单 Agent」这个大目标,拆成 5 个模块、6 个文件、8 步数据流、6 项验收标准

第2期结构设计、第5期任务规划、第7期整合检查表

验收能力

知道怎么判断结果是否正确:不只看有没有报错,还要看智谱的判断是否合理、字段有没有错位、原文件有没有被修改

第6期的两层自检设计 + 实际故意出错的测试

调试提问能力

出错时提供「具体现象 + 日志 + 初步判断」,让 Codex 快速定位问题,而不是只说「有 bug 帮我修」

每期「遇到问题怎么办」里的报错处理经验

迭代能力

从最小可用版本开始,每次只加一个功能,边加边验证,不追求一步到位

整个 8 期课程的结构本身——每期只做一件事,做完验证,再进下一期

这 5 种能力的本质: 它们是「用 AI 工具做事」的通用能力——不只适用于做报价单 Agent,也适用于用 Codex 做任何项目、给智谱写任何 prompt、用 AI 工具完成任何任务。你在做这个 Agent 的过程中,顺带训练了一套通用的「AI 协作能力」。

坦白说,我觉得这 5 种能力的价值,远大于你学会了具体的某个技术框架。框架会过时,但这套做事方式不会。


三、你的 Agent 知识地图

图片

把8期的核心知识点整理成三个层次。这张地图你可以收藏,之后遇到 Agent 相关的概念,都可以对照这里找到位置:

概念层——是什么

知识点

一句话理解

AI / LLM / Chatbot / Workflow / Agent

Agent = AI 大脑 + 工具 + 自主规划,能真正帮你做事,不只是告诉你答案

上下文窗口

AI 的「工作桌面」有大小限制,超出就丢弃最早的内容;对话结束桌面清空,这就是 AI 没有记忆的本质

智谱 API

通过 HTTP 请求调用智谱模型的接口;ask_zhipu() 发指令,ask_zhipu_json() 要求返回结构化数据

Token 和费用

约 1 个汉字 = 1.5 个 Token;处理一份报价单约消耗 500-800 Token

机制层——怎么做到的

知识点

一句话理解

工具调用 / Function Calling

AI 只发指令,程序去真正执行,结果再返回 AI;AI 从头到尾只处理文字

RAG 5步流程

切片→向量化→存库→检索→生成;让 AI 基于你的真实文档工作,而不是靠猜

智谱语义搜索

把客户列表和搜索描述一起发给智谱,智谱理解语义并返回最匹配的客户;比 TF-IDF 更灵活,能处理「南山区那家」这种模糊描述

Plan-and-Execute

先让智谱把所有步骤规划出来、你确认、再按顺序执行;适合批量处理等步骤固定的场景

ReAct 循环

思考→行动→观察→继续,每步根据实际结果决定下一步;适合处理格式不固定的复杂任务

实践层——怎么用好

知识点

一句话理解

工具设计三原则

单一职责 + 描述清晰 + 返回易读;工具描述写清楚,智谱调用出错的概率大幅降低

给智谱写 prompt 的关键

说清楚角色、输入、输出格式、边界约束;要 JSON 就明确说「只返回 JSON,不要任何其他文字」

目标漂移防范

描述加边界(不能做什么)+ 执行前展示计划 + 批量操作加预览确认

两层自检设计

规则检查快速过滤明显问题(不消耗 API),智谱审查处理规则覆盖不到的语义问题

调试三要素

具体现象 + 相关日志 + 初步判断;这三个信息给全,Codex 能直接定位问题

线程与界面

智谱 API 调用放在后台线程,用 queue 传递消息更新界面,界面才不会卡死


四、接下来 3 个月的规划

图片

8期结束,但迭代没有结束。根据大家在评论区提到的真实需求,这是一个可参考的 3 个月规划:

第 1 个月:让它真正融入日常工作

目标:把这个 Agent 变成你日常出报价单的默认工具,在真实工作中用起来。

具体做法:

  • 把你真实的客户资料都录入 客户资料.json,不要只用示例数据

  • 每次出报价单都用这个程序,记录遇到的问题(智谱匹配错了?字段没填上?界面哪里不顺手?)

  • 集中修复最影响日常使用的 3 个问题——用 Codex 解决,每次修复完验证一遍

完成标志:连续用 2 周,没有出现需要手动纠正的错误。

第 2 个月:扩展一个真正需要的功能

目标:根据第 1 个月的真实使用,找到最痛的一个点,加一个新功能。

高频需求参考(选一个,每次只加一个):

需求

难度

怎么加

支持 PDF 格式的报价单

⭐⭐

安装 pdfplumber 库,新增 read_pdf 工具函数

生成完报价单后自动发邮件

⭐⭐⭐

用 Python 的 smtplib 库,让智谱生成邮件正文,附上报价单文件

支持从 Excel 表格批量导入客户

⭐⭐

用 openpyxl 读取 Excel,转成 客户资料.json 的格式导入

报价单生成后自动保存到指定云端文件夹

⭐⭐⭐

接入云盘 API

每次只加一个,加完在真实场景里测试稳定了,再考虑加下一个。

第 3 个月:沉淀方法,准备做第二个 Agent

目标:把这 8 期学到的方法沉淀成可复用的资产,开始规划第二个 Agent。

具体做法:

  • 整理你自己的提示词模板库:把每期「发给 Codex 的提示词」里有效的部分存成文档,下次做新项目直接复用

  • 把 llm.py 整理成通用模块:它不只适用于报价单场景,任何需要调用智谱的项目都可以复用

  • 规划第二个 Agent:用同样的方法论——先想清楚「输入是什么、输出是什么、智谱在哪几个环节做判断」,再动手

第 3 个月最重要的事:做第二个 Agent。

第一个 Agent 是学习的过程,第二个才是验证的过程——验证你是不是真的掌握了这套方法论,而不只是跟着课程走了一遍。第二个 Agent,从立项到跑通的速度,应该比第一个快至少一倍。如果没有快,说明有什么东西还没真正内化,值得回头再想一遍。


五、给整个系列一个句号

图片

我想用一句话来总结这 8 期:

做 Agent 最核心的不是写代码,是把你想做什么说清楚——说给 Codex,说给智谱,说给自己。

你把目标说清楚了,Codex 能帮你写代码;你把任务说清楚了,智谱能帮你做判断;你连自己都没想清楚,再好的工具也帮不了你。这不是 AI 的限制,这是「思考」本身的价值。

这 8 期的价值,不只是你学会了 RAG 或者智谱 API,而是你练了一遍「怎么把一个模糊的想法,一步步变成一个可以真实运行的、有 AI 大脑的产品」。

从第3期第一次在终端里看到报价单被自动填好,到第7期把整个系统装进一个窗口应用,交给不懂技术的人也能用——这个过程里你不只是在「学 Agent」,你是在练一种工作方式:把问题拆清楚,用对工具,一步一步验证,不追求一步到位。

这种工作方式,在 AI 时代会越来越重要。

系列结束了,但不是全部结束。

我会继续更新——记录我怎么迭代这个报价单 Agent,加入邮件发送、PDF 支持,以及我开始做第二个 Agent 的全过程。

关注我,我们继续。


思考题: 8期学下来,你最有收获的是什么?是某个具体的技术,还是这套工作方式?评论告诉我。


关注公众号「AI淇橦学」,和 AI 一起成长。

有问题或建议?后台留言即可。

后台回复“Agent”,领取课程讲义。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐