Agent LATS：我说“像人一样给我出一个方案，直接开干，不要问我！”

a15230334885

12人浏览 · 2026-06-07 00:04:50

a15230334885 · 2026-06-07 00:04:50 发布

Agent LATS：我说“像人一样给我出一个方案，直接开干，不要问我！”

—— 带方向盘的人机协同规划策略

LATS的核心搜索过程包括六个步骤：选择（Selection）、扩展（Expansion）、评估（Evaluation）、模拟（Simulation）、回溯（Backpropagation）和反思（Reflection）。

从我的角度上看，这个决策方式是很符合项目规划的。

比如在进行一些方案规划的时候，需要
调研（扩展、模拟）→ 初评（评估）→ 复盘与教训沉淀（反思）→ 决策（选择）→ 迭代（回溯）
才能确定最后的方案

只不过现在的这个流程交给了LLM

1. Agent方案对比

	推理	行动	规划	反思	外部记忆	备注
CoT（思维链）	√
ReAct	√	√
ToT（Tree of Thoughts）	√		√			闭门造车式论文中有外部记忆，但是我记得是没有的
RAP	√		√		√	自己推演一下
Reflexion	√	√		√	√
LATS	√	√	√	√	√

2. 执行流程

在这里插入图片描述

从图上可以看到，它的过程类似普通的回溯算法。只是不是通过代码写死过程，而是让LLM来动态的创建过程。
总结一下过程就是

推理扩展：针对当前节点，让 LLM 生成多个可能的下一步（想法/动作）
评估与模拟：对每个新节点，直接打分（评估），或快速推演至终局看潜力（模拟），得到初步价值
反向传播：将价值沿路径回传，更新上级节点的累计分数
选择：根据更新后的分数，挑出最有潜力的节点继续深入
若陷入死胡同，则回溯到上一个分支点，并触发反思，生成教训存入记忆，避免后续重蹈覆辙

3. 个人思考

由此可以看出LATS很适合做规划探索可能性而不是实施。
我认为这是一种很适合人机交互的策略：

人做什么（定目标、给约束、判断可行性）
agent 做什么（快速搜索、生成候选、模拟推演、反思沉淀）
迭代机制（人看搜索树，剪掉不靠谱分支，注入自己经验，再让 agent 继续搜）
这其实是一种“交互式规划”，远比一次性让模型出方案可靠得多。

4. 存在的问题

成本高：每一步都调用多次 LLM（扩展、评估、模拟、反思），复杂任务树很大时，Token 消耗极高。

记忆噪声：反思积累多了，可能出现陈旧或不准确的教训，反而误导后续决策。

对于短平快任务意义不大：简单任务用 CoT 或 ReAct 就够，LATS 有点“牛刀杀鸡”。

如何解决

成本高 → 可使用更小的模型做评估/模拟，或限制树的宽度深度
记忆噪声 → 引入反思遗忘机制、时间衰减权重，或人工定期清理
短任务不适用 → 可以设计一个路由机制，简单任务走轻量链式推理，复杂任务自动升级到 LATS

因此在采用这种方式的时候，有时需要人去介入维护它的经验，防止“坏的经验”累积

5. 代码参考（论文中的）

https://github.com/lapisrocks/LanguageAgentTreeSearch

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

Claude Code 通信机制逆向分析

使用 Proxyman 抓包工具对 Claude Code 的 API 通信进行完整逆向分析，浅谈 AI Agent 的工作机制。

AtomGit开源社区

【分享】手机散热器游戏党降温神器

AtomGit开源社区

【分享】编程猫最新版[特殊字符]青少年零基础编程器[特殊字符]小白[特殊字符]操作

📣【软件介绍】Scratch是由麻省理工学院“终身幼儿园团队”开发的图形化编程软件，面向8至16岁青少年，通过拖拽积木式代码块创作互动故事、游戏和动画。它无需编写复杂语法，支持跨学科应用，培养逻辑思维与创造力，链接:https://pan.baidu.com/s/1RxT03cgDzFBZzcGAiLU2tw?如果感觉软件好玩，有趣，有用，麻烦您在评论区反馈下~吱一声就是最大的鼓励哈！拿走吱一声