Harness Engineering

开源至上

211人浏览 · 2026-06-08 11:02:45

开源至上 · 2026-06-08 11:02:45 发布

Harness Engineering（束具工程/控制框架工程） 是 2026 年 AI Agent（智能体）领域兴起的一个新概念。它强调的不是如何让模型变得更聪明，而是如何构建一套围绕模型运行的“控制系统”，让 AI 在真实生产环境中变得可靠、可控和可验证。

简单来说：

Prompt Engineering：是教 AI 怎么想；
Context Engineering：是教 AI 看什么；
Harness Engineering：是规定 AI 在什么环境下工作，以及如何防止它犯错；

一个形象的比喻

很多文章都用同一个比喻：

大模型（GPT、Claude、Gemini）= 一匹非常强大的马
Harness（马具、缰绳）= 控制和引导马的系统

马很有力量，但如果没有缰绳：

会跑偏
会撞墙
会失控

Harness Engineering 的目标就是：

让强大的 AI 能够稳定完成任务，而不是偶尔表现惊艳、偶尔灾难翻车。

Harness 包含什么？

在 AI Agent 系统中，一个 Harness 通常包含：

1. Context 管理

决定 AI 能看到哪些信息。

例如：

项目代码
数据库结构
用户历史记录
企业知识库

而不是把所有内容一次性塞给模型。

2. Tool 管理

规定 AI 可以调用哪些工具。

例如：

搜索
数据库查询
Git
邮件发送
浏览器操作

以及：

什么情况下允许调用
调用次数限制
权限控制

3. Verification（验证机制）

这是 Harness 的核心。

例如 AI 写代码后：

写代码
↓
运行测试
↓
检查结果
↓
失败则重试
↓
成功才提交

不是让 AI 自己说：

“我觉得完成了。”

而是用客观验证证明完成。

4. Guardrails（护栏）

限制危险行为。

例如：

不允许删除生产数据库
不允许访问敏感文件
超过金额必须人工审批
涉及法律问题必须转人工

5. Memory（记忆）

帮助 Agent 长期工作。

例如：

记住之前做过什么
记住项目进展
记住失败案例

否则 Agent 工作几小时后就会“失忆”。

6. Observability（可观测性）

记录 Agent 的全部行为。

例如：

为什么调用这个工具？
为什么修改这个文件？
为什么做出这个决定？

方便排查错误。

为什么它突然火起来？

因为大家发现：

Agent 的问题往往不是模型不够强。

而是：

模型能力 × Harness质量

例如：

GPT-5
Claude
Gemini

换模型可能提升 10%-20%。

但如果 Harness 很差：

错误权限
错误上下文
没有验证
没有回滚

再强的模型也会翻车。

相反，一个优秀 Harness 可以让中等模型表现得像顶级模型。

和 Prompt Engineering 的区别

Prompt Engineering	Harness Engineering
写提示词	构建运行系统
单次交互	长周期任务
关注模型输入	关注整个执行流程
靠提示约束	靠系统约束
AI说自己完成	系统验证是否完成

很多业内人士认为：

2023 = Prompt Engineering
2024-2025 = Context Engineering
2026+ = Harness Engineering

AI 工程的重点正在从“写提示词”转向“设计 Agent 运行环境”。

一个真实例子

假设你要做一个自动修 Bug 的 AI Agent。

旧思路（Prompt Engineering）

请帮我修复这个Bug

AI 直接输出代码。

Harness Engineering 思路

读取Issue
↓
定位相关文件
↓
生成修复方案
↓
修改代码
↓
运行单元测试
↓
运行Lint
↓
检查安全规则
↓
生成PR
↓
人工审核

这里真正复杂的部分不是模型。

而是整个流程设计。

这个流程本身就是 Harness。

一句话总结

Harness Engineering 就是为 AI Agent 构建“操作系统”和“安全框架”。

如果说：

LLM 是大脑，
Prompt 是指令，
Context 是记忆，

那么：

Harness 就是让这个大脑能够在现实世界稳定工作的整套运行环境。

它目前已经成为 Agent 开发、AI Coding（如 Claude Code、Codex、Cursor 等）和企业级 AI 系统中的热门方向。

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

G-Star 精选开源项目推荐｜第二十期

AtomGit开源社区

开源鸿蒙大学生创新大赛三大赛道全面开赛，176 万奖金池已就位

AtomGit开源社区

这个夏天，把名字写进仓颉生态三方库共建计划上线

AtomGit开源社区

所有评论(0)

查看更多评论

开源至上

@weixin_44273367

已为社区贡献12条内容

Harness Engineering

开源至上

一个形象的比喻

Harness 包含什么？

1. Context 管理

2. Tool 管理

3. Verification（验证机制）

4. Guardrails（护栏）

5. Memory（记忆）

6. Observability（可观测性）

为什么它突然火起来？

和 Prompt Engineering 的区别

一个真实例子

旧思路（Prompt Engineering）

Harness Engineering 思路

一句话总结

所有评论(0)

温馨提示：您尚未绑定手机号

开源至上