词源追溯:从马术到AI

“Harness”一词源自马术,本意为“马具”——缰绳、马鞍、挽具的总称。

这个隐喻非常贴切:将底层大语言模型比作一匹拥有强大动力但高度不可控的野马,而Harness就是人类用来限定其行为、引导其前进方向的缰绳与传动系统。骑手则是人类工程师,负责明确意图、设计环境和构建反馈回路。

换言之,Harness Engineering不是要改变“马”的基因(模型本身),而是为它设计一套专业的马具和训练方法。

什么是 Harness Engineering?

Harness Engineering 是一门设计 AI 智能体运行环境、约束边界和自动化反馈循环的系统工程学科。

如果把 AI 模型比作一具强大的发动机,那么 Harness(挂载系统/线束) 就是那台跑车的底盘、刹车、变速箱和仪表盘。它不关注如何优化“指令”本身,而是关注如何构建一套物理和逻辑框架,让 AI 在其中安全、可靠、自主地完成任务。

核心逻辑: >

当 AI 犯错时,传统的 Prompt Engineering 会教你“改进提示词”;而 Harness Engineering 则要求你“修改系统架构”,让该错误在结构上无法再次发生。


名词来源:从“黑客习惯”到“工程规范”

1. 词源背景

“Harness”一词最早在传统软件工程中指 Test Harness(测试桩/测试床),即为测试某个模块而搭建的支撑环境。在 AI 领域,这个概念在 2025 年底至 2026 年初 经由 Mitchell Hashimoto等工程界大佬的推广而破圈。

2. 演进动力:OpenAI 的“百万行代码”实验

2026年初,OpenAI 分享了一项内部实验:一个小型团队在 5 个月内利用 Codex 智能体交付了约 100 万行生产级代码,且过程中没有人类手动编写过一行源代码。

他们成功的秘诀并非用了更强的模型,而是构建了一套名为 Harness 的框架。这套框架强制执行了:

  • 结构化约束: 定义了代码依赖的单向流转(如 Types -> Service -> UI)。
  • 验证门控: 智能体提交代码前,必须自动通过 CI 验证和模拟运行,否则任务被强制回滚。
  • 状态接力: 解决了大模型“上下文遗忘”的问题,通过物理文件持久化任务进度。

技术演进:从 Prompt 到 Harness

AI 协作模式经历了三个关键阶段的飞跃:

阶段 核心技术 关注点 比喻
1.0 Prompt Engineering 指令的精确性 给新员工下达口头指令
2.0 Context Engineering 外部数据的检索 (RAG) 给新员工参考资料和手册
3.0 Harness Engineering 系统架构与反馈闭环 给员工办公流程、权限系统和质检员

Harness Engineering 的核心组件

要构建一个真正的 Harness 系统,通常包含以下三个层面:

1. 架构边界 (Architectural Constraints)

不再仅仅用文字告诉 AI “不要碰数据库”,而是通过 容器化沙箱API 权限管理,在底层切断其越权路径。利用机器可读的配置文件(如 .cursorrulesAGENTS.md)定义项目的硬性红线。

2. 验证门控 (Verification Gates)

AI 任务的完成不应由 AI 自己宣告(它经常会产生幻觉),而应由确定性的系统判定。

  • 代码场景: 必须通过 Linter 静态扫描和单元测试。
  • 业务场景: 必须符合预设的 Schema(模式)验证。

3. 反馈循环 (Feedback Loops)

当 AI 陷入死循环(Looping)或连续尝试失败时,Harness 系统会自动介入。

  • 循环检测: 监控同一位置的修改次数,触发强制性的“重置提示”或人工干预请求。
  • 可观测性: 记录 AI 每一轮的 Tool Call 轨迹,像监控生产服务器一样监控 AI 的行为逻辑。

发展趋势:AI 开发的“工业化时代”

  1. 从“Vibe Coding”转向“Agentic Engineering”

    Andrej Karpathy 曾提到的“靠感觉编程(Vibe Coding)”正在退场,取而代之的是严谨的 Harness 框架。未来,工程师的职责将从写代码转向写 Harness

  2. Harness 作为标准基础设施

    正如我们现在使用 Docker 部署应用,未来的 AI Agent 将运行在标准化的“Harness 运行时”中。类似 LangGraph、CrewAI 以及 Anthropic 的新版 SDK 都在向这一方向演进,提供开箱即用的权限与状态管理。

  3. 自修复 Harness (Self-Healing Harness)

    未来的高级 Harness 将具备自愈能力——当 AI 发现现有的环境约束阻碍了任务完成,它可以提议修改 Harness 配置,并在人类审核后自动生效。


结语

Harness Engineering 的崛起标志着 AI 从“对话玩具”真正走向“生产力工具”。它承认了 AI 的不完美,并试图通过人类积累了几十年的系统工程经验来包容这种不完美。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。