告别“玩具级” Agent:我复盘了旅行助手、深度研究与赛博小镇,悟透了 AI 应用的落地逻辑
在学完《Hello Agents》的前十章后,我曾一度陷入迷茫:懂了协议、记忆和上下文工程,到底该怎么拼出一个能用的产品?
直到我啃完了最后这三章——智能旅行助手、自动化深度研究、赛博小镇。这三个项目不再是简单的“调包演示”,而是从架构设计到多智能体协作的深度实战。今天不聊虚的,咱们直接拆解这三个项目的底层逻辑,看看如何把 Agent 从“单机版”推向“生产级”。
1. 智能旅行助手:多智能体协作的“流水线艺术”
以前写 Agent,我总喜欢用一个超级 Prompt 让它干所有事:搜景点、查天气、订酒店、排行程。结果就是:要么 LLM 忘了调用工具,要么输出的 JSON 格式错乱。
第十三章的旅行助手给了我一个巨大的启发:与其让一个 Agent 累死,不如搞个“旅行社”分工协作。
为什么需要多 Agent?
- 解耦复杂度:
AttractionSearchAgent只负责搜景点,WeatherQueryAgent只负责看天。每个 Agent 的 Prompt 极其简单,几乎不会出错。 - 并行与串行结合:虽然代码里是串行调用,但在架构上它们已经独立。未来想加一个“美食推荐 Agent”,根本不用改其他三个的代码。
- 数据标准化(Pydantic 的胜利):项目中大量使用了 Pydantic 模型。从前端 Vue3 的 TypeScript 接口,到后端 FastAPI 的请求验证,再到 Agent 输出的 JSON 解析,全链路统一数据结构。这才是工程化的核心,而不是那个 LLM 调用。
💡 我的思考:多智能体不是越多越好,而是要根据“业务边界”切分。旅行助手的四个 Agent 恰好对应了用户规划行程的四个心理步骤:想去哪 → 天气咋样 → 住哪里 → 怎么排。这种以用户心智模型为蓝本的 Agent 设计,比单纯的技术堆砌更有价值。
2. 深度研究助手:TODO 驱动的“自我进化”
如果说旅行助手是“执行者”,那第十四章的深度研究助手就是一个“思考者”。它解决了一个痛点:LLM 的上下文是有限的,但研究是无限的。
核心范式:TODO-Driven Research
这个项目的精髓在于那个 TODO Planner。它不直接回答问题,而是先把大问题拆成 3-5 个子任务(TODO):
- 规划:把“Datawhale 是什么”拆解成“基本信息”、“开源项目”、“社区文化”。
- 执行:针对每个 TODO,调用
SearchTool搜集信息,再用Task Summarizer提炼干货。 - 整合:最后由
Report Writer把所有碎片拼成一篇带引用的 Markdown 报告。
最让我震撼的是它的反思机制。如果某个子任务搜不到东西,它会意识到“知识空白”,然后自动调整搜索关键词再试一次。这不就是我们人类做研究时的样子吗?
💡 我的思考:未来的 Agent 开发,核心竞争力不在于你会不会调 API,而在于你能不能设计出“可迭代的研究流程”。通过
NoteTool记录中间状态,让 Agent 拥有了“短期工作记忆”,从而突破了单次对话的长度限制。
3. 赛博小镇:当游戏引擎遇上 Memory System
第十五章是最有意思的,它把 Agent 从 Web 界面拉进了 Godot 游戏引擎。这不是一个简单的聊天机器人,而是一个拥有记忆、好感度和人格的 NPC 系统。
混合模式:批量生成 + 即时响应
在游戏里,如果每个 NPC 每秒都调一次 LLM,服务器早就崩了。项目里用了一个极聪明的方案:
- 背景对话(批量):后台每 5 分钟跑一次批量生成,给所有 NPC 刷新一段“正在做的事”(比如“我在修 Bug”)。玩家路过时看到的是这些缓存内容,成本极低。
- 交互对话(即时):只有当玩家按下 E 键互动时,才触发专属 Agent 的实时推理。这时候会带上记忆系统检索到的历史片段和当前的好感度分数。
好感度系统:量化的关系
好感度不再是隐藏数值,而是直接影响 LLM 的 System Prompt。
- 陌生阶段:Prompt 强调“礼貌、疏远”。
- 挚友阶段:Prompt 强调“热情、分享秘密”。
这种动态 Prompt 技术,让 NPC 真的有了“养成感”。
💡 我的思考:赛博小镇证明了 Agent 不一定非要是“工具人”。在游戏化场景下,Memory(记忆)和 Relationship(关系)才是 Agent 的灵魂。通过 Qdrant 向量库检索 Episodic Memory(情景记忆),NPC 居然能说出“记得你上次问过我 Python 的问题”,这种体验是颠覆性的。
总结:从 Demo 到 Product 的跨越
复盘这三章,我发现 HelloAgents 框架其实在传达一种工程哲学:
- 结构化大于一切:无论是 Pydantic 数据模型,还是 TODO 列表,亦或是好感度等级,都在试图把不可控的 LLM 输出变成可控的结构化数据。
- 状态管理是核心:旅行助手的行程状态、研究助手的笔记状态、赛博小镇的记忆状态。谁管好了状态,谁就管好了 Agent。
- 分层架构是标配:前端(Vue/Godot)负责表现,后端(FastAPI)负责路由,Agent 层(HelloAgents)负责推理,外部服务(Map/Search/LLM)负责能力。这种解耦让系统极具扩展性。
如果你也刚学完 Agent 的基础理论,别犹豫,直接上手这三个项目。因为在调试 TripPlanner 的 JSON 解析错误时,在优化 DeepResearch 的搜索策略时,在调整 AI-Town 的好感度参数时,你才算真正入了 Agent 开发的门。
👋 我是 yibo,一个正在死磕 Agent 落地的开发者。如果你对这三个项目的源码实现感兴趣,欢迎在评论区交流,我们一起避坑!另外,我正在寻找一起做AI应用的小伙伴,如果你有兴趣,可以私信我哦~~~
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐


所有评论(0)