Harness Enginner记录-驾驭AI Agent之术

ASKED_2019

74人浏览 · 2026-04-16 00:02:40

ASKED_2019 · 2026-04-16 00:02:40 发布

最近Harness engineering在AI 圈又火了起来，在openclaw之后，这个概念有AI 头部公司Antropic和openai一起强调，晚上找了一些资源，感觉还是云里雾里，恰好台大李弘毅开放了对应的一期视频，这里刚好记录下。
讲Harness之前，先聊聊大模型应用侧的演进化，到目前为止基本是三个阶段:

最早期大家都是与大模型进行one on one的交流，just one loop in a time，这时候一个好的prompt很重要，因为这决定了大模型的输出
当人类一次又一次的体会大模型的5s记忆时（实际上大模型没有记忆，他是在一个小黑屋里的，他只能知道当前的input，然后完成词语接龙），终于忍无可忍，提出了context enginner，把之前的内容也告诉大模型，让他有了一定的记忆
后面也就是现在，我们已经不满足与大模型在一个文本框里进行one loop by one loop的交互，我们希望大模型又能力与环境自己交互，一个成熟的大模型应该自己解决实际问题，自我进化反思，不是依赖与人类反馈，这个时候就是Harness Enginnering提出

在这里插入图片描述
那么什么是Harness Engineering，顾名思义，就是一套控制驾驭大模型的工程，是一套方法论，通过设计一套外部框架或规则，来规范与引导 AI 模型（尤其是作为 Agent 时）的行为。它与传统的 Prompt Engineering 有所重叠，但更强调对多轮对话过程与执行逻辑的控制。

Harness Engineering 的本质目标是减少模型的不确定性

具体的怎么操作呢，李老师将其细化为以下三个控制层面：

1. 通过人类语言控制-认知框架

通过在 Prompt 中加入强制性步骤，其实就是给AI写一个工作手册，一把来说就是一个agent.md 或 System Prompt，利用自然语言为 AI 设定身份、价值观和逻辑准则。
在这里插入图片描述
课程里还是以龙虾小金为例子，介绍了小金的灵魂其实就是Agents.md 文档，当claude Code禁止使用龙虾后，他把Agents.md 改了个名称就成功在Cowork里面复活了小金，说明这个md文档就是AI的认知框架，之前的claude Code架构文章里面，我们知道每次这个都会作为context输入给大模型。
在这里插入图片描述
最后还提到了一些论文和研究：
在openai的研究中，在工程技术：在智能体优先的世界中利用 Codex 提到Agents.md 的一些原则，他应该是一个Map/索引手册，而不是一个大百科全书，效果前者要好于后者。

2. 透过工具控制能力边界

我们希望模型能有一些能力与真实世界交互，所以我们会为模型提供可调用的外部工具（如 Bash 脚本、Python 解释器、搜索 API 等）
另一方面，当时我们也不希望模型没有任何控制，之前小龙虾爆火的时候就有一些依赖小龙虾，然后某巨头高管把自己邮件删除完了的例子，所以模型应该有一些能力边界，所以我们可以限制一些工具。
在这里插入图片描述
这里对比了openclaw和cowork，cowork在程序里设置了固定的能力边界，设定了AI Agent的作用范围，更加安全，自由<-> 安全不可能同时达到。

3. 透過「工作流程」控制 ——「行為」

定义：设计固定的互动步骤（Workflow），例如：观察 $\rightarrow$ 思考 $\rightarrow$ 行动 $\rightarrow$ 验证。

作用：直接规范模型的具体行为模式。视频中提到的“强制要求模型修改前必须先 cat 文件”，就是通过工作流程强制纠正了模型“瞎猜”的行为。
在这里插入图片描述
在这一部分，介绍了一些流程控制的方法，简单来说，很重要的一点，也是一个容易想到的，生成后面加一个verifier的角色。

这个Verifier可以是另一个大模型，之前就有claude code当执行，codex当裁判的例子
也可以是模型应用的工具的输出的feetback

模型不断的获取feedback，然后不断演进，这个有一个专业术语，叫Ralph Loop。
在这里插入图片描述
还有的就是提到了feedback 的Summary，有时为了防止模型的输入太长，我们会对one loop进行summary。

不过李老师提到了，不是所有模型summary都会提升效果，Sonnet就适合压缩，Opus就不用，这个要看具体的模型
在这里插入图片描述
进一步的，还讨论了基于feedback的模型进化与难点：

简单的，模型多次feedback以后成功后，我们可以形成一个skill
进一步的，可以用来迭代大模型本身，利用RL的一些方法。

最后还有一个比较有意思的事情: AI也要正能量

不要骂AI笨蛋，否则他会越来越蠢

在这里插入图片描述

Reference:
1. Harness Engineering：有時候語言模型不是不夠聰明，只是沒有人類好好引導
 2. Effective harnesses for long-running agents
3. 工程技术：在智能体优先的世界中利用 Codex
4.Harness design for long-running application development

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

输入处理输出结构递归嵌套模型技能ipo-model

IPO模型是一种递归嵌套的输入-处理-输出结构，作为万物基元与世界模型。它将所有任务分解为IPO单元，其中任意节点可继续展开为子IPO。执行时分为纯认知（直接生成输出）和工具增强（调用command/script/Tool/Skill/MCP）两种模式，工具选择遵循由简到繁的降级原则。该模型提供统一的认知与执行框架，适用于各类任务，从简单翻译到复杂系统操作均可通过IPO树实现结构化处理。

AtomGit开源社区

计及自适应预测修正的微电网 MPC 优化调度方法研究（Python代码实现）

针对高比例可再生能源接入微电网后面临的源荷功率波动显著、预测误差难以抑制、储能长期约束难以闭环等问题，本文提出一种融合自适应预测修正与模型预测控制（MPC）的微电网优化调度方法。该方法构建自适应预测修正环节，基于源荷实测与预测的误差反馈动态调整预测结果，降低不确定性对调度的影响；以滚动优化为核心，在有限时域内实现运行成本最优与多设备约束协同满足；增设全局储能荷电状态（SOC）校正环节，确保调度周期