Agent 时代的工程范式跃迁：从 Prompt 到 Harness

bytesort

525人浏览 · 2026-06-08 21:41:34

bytesort · 2026-06-08 21:41:34 发布

摘要：底层模型决定智能上限，而包裹在其外层的 Agent Harness（运行骨架）则直接决定系统在真实生产环境中的落地成败。

在许多团队试图让大模型跑通端到端业务时，经常会遇到难以逾越的工程瓶颈。例如让 AI 修复一个复杂的开源库 Bug，它们往往会在连续执行多步操作后，因为一次微小的工具超时、文件锁冲突或者模型输出格式走样，导致整个长链路任务瞬间溃散、无法恢复。这并非底层模型的推理算力不够强，而是系统缺乏能够在长周期、高动态环境下兜底的可靠骨架。

为了解决这种多步执行在工程上的脆弱性，业界正在悄然发生一场“重构外壳”的范式革命。人们开始意识到，必须为无状态的大模型搭配一套能够感知、隔离并能够自动纠错的运行骨架，从而引出了当前重塑整个 AI 基础设计的核心概念——Agent Harness。它为模型提供了长效运行的基础设施与安全操作系统，正成为让智能真正平稳落地的关键力量。

什么是 Agent Harness？

在传统的软件工程中，硬件与应用之间必须有操作系统的存在。如果用计算机系统架构来做类比，现代 AI 系统的层级关系可以得到非常直观的理解：

大语言模型就像是 CPU，负责提供最基本的推理与计算算力，但它本身是没有状态的，无法直接独立运行；上下文窗口则是 RAM，负责提供临时的、易失的高带宽工作内存，用来存储对话中转的状态；而 Agent Harness 则是操作系统（OS），它为模型提供了运行所需的基础设施、安全壁垒、控制回路与网络连接；最后，特定的业务 Agent 则是跑在操作系统上的应用程序。

简而言之，Agent Harness 就是包裹在基础大模型外层的一切代码、配置和运行时环境的总和。大模型负责输出智能，而 Harness 则负责提供让这种智能安全落地、稳定运行并可与现实世界安全交互的系统支撑。

在这里插入图片描述

从 Prompt 到 Harness

回顾 AI 落地应用的技术演进，整个工程界的关注重心在过去几年里经历了三次深刻的底层迁移。最初，人们将所有期望寄托于如何向模型提问，通过调试提示词以榨取单次输出潜能，诞生了 Prompt Engineering；随后，随着长上下文窗口和检索技术的成熟，工程重点转向了 Context Engineering，聚焦在如何精准压缩、提取并输入有效上下文。而到了 2026 年，系统如何在真实物理世界中实现无人工干预的闭环运转，推动行业进入 Harness Engineering 时代。

在这里插入图片描述
在这一轮由应用边界倒逼的进化中，行业的发展轴线由几个里程碑式的时间节点连缀而成：

在 2025 年 11 月，Anthropic 发布工程博客《Effective harnesses for long-running agents》，系统性地阐述了如何通过 Agent Harness 的设计来解决长周期任务中的失忆与漂移问题。

随后在 2026 年 2 月 5 日，HashiCorp 联合创始人 Mitchell Hashimoto 发表博客《My AI Adoption Journey》，首次提出了 Harness Engineering 的工作方法。他强调每当 Agent 在执行任务时犯错，不要只做一次性修复，而是工程化地构建一套防止同类错误重犯的机制。

紧接着在 2026 年 2 月 11 日，OpenAI 发表博文《Harness engineering: leveraging Codex in an agent-first world》，深度总结了其在利用 Codex 智能体进行“零人工代码”生产实验。团队通过在 Harness 层引入完整的本地可观测性监控和严格单向分层架构约束，保证了 3 到 7 人团队在 5 个月内驱动 Codex 完成了约 1500 个 PR 的生成与合并，验证了闭环 Harness 工程的强悍力量。

而在 2026 年 5 月，学术界发布了长达 70 多页的首篇 Agent Harness 综述论文《Agent Harness Engineering: A Survey》。这一事件标志着一线工业界的工程探索，已经正式被学术界梳理并沉淀为行业共识，Harness Engineering 也由此成为了一门独立的学科体系。

Harness 的七层架构体系

随着 Agent 从玩具走向严肃的生产环境，业界开始对这套 Harness 工程进行系统性总结。2026 年 5 月发表在 OpenReview 上的全景综述论文《Agent Harness Engineering: A Survey》，首次提出了 ETCLOVG 七层架构体系。这七层架构规范了智能体运行时骨架的每一个设计维度：

1. E (Execution) 执行环境
决定 Agent 运行的物理与安全边界，同时承担安全隔离、可复现性和存活度三重职责。论文将当前沙箱生态划分为七类：通用托管沙箱、计算机使用环境、代码专用沙箱、框架内置运行时、浏览器评测环境、操作系统级权限沙箱，以及沙箱抽象层。

2. T (Tool) 工具接口
解决 Agent 如何发现、描述和调用外部能力。生产实践表明暴露过多工具不仅会增加上下文成本，也会导致可靠性下降。其中，MCP、A2A、Function Calling 和 AGENTS.md 用于解决不同层面的接口问题。

3. C (Context) 上下文与记忆
管理模型在每个执行步骤能看到的信息。更大的窗口不等于更好的记忆。论文将上下文管理按时间尺度分为三层：短期（KV 缓存感知设计、渐进式披露等）、中期（会话级持久化）、长期（跨会话可检索的持久记忆存储）。

4. L (Lifecycle) 生命周期与编排
管理单 Agent 内循环、多 Agent 编排模式以及从 Issue 到 Pull Request 的全生命周期流水线。论文将当前编排系统分为三类执行模型：无状态回放（Codex CLI 式，每次从头构建上下文）、有状态（维护协调状态、角色分配、任务图），以及混合型。

5. O (Observability) 可观测性
全面监控 Agent 长链路执行，将每次模型调用、工具执行、检索步骤记录为可检查的 trace，支撑故障诊断、成本核算与可靠性工程。论文提出了“Harness 即假设”原则——理想的可观测系统不仅要检测 Agent 何时失败，还要检测哪些 Harness 组件已经变成不必要的开销。

6. V (Verification) 验证与评估
将 Agent 行为转化为可诊断的工程证据，论文将其组织为一个五阶段的“任务到反馈”生命周期：任务与基准测试对齐、执行前准备检查、受控执行、多级判断（结果层、轨迹层、评估器层）与故障归因以及持续回归与部署反馈。

7. G (Governance) 治理与安全
约束 Agent 行为的权限边界，通过权限模型与身份管理、生命周期钩子、组件加固、声明式宪法、审计基础设施等机制，建立从人类到 Agent 的可追溯安全与问责链。

在这里插入图片描述

只换 Harness 不换模型

在许多团队纠结于使用 7B 模型还是 70B 模型时，工业界的实验数据已经给出了一个令人振奋的结论：只换运行时 Harness，不换任何底层大模型，就能让 AI 系统的最终表现产生质的飞跃。

LangChain 官方在最近的 Terminal-Bench 2.0 评测中进行了一次极具说服力的对照实验。他们使用完全相同的底层大语言模型，仅仅对其外层的运行时 Harness 进行了工程重构，结果其复杂长周期任务的成功率直接从原先的 52.8% 跃升至 66.5%，足足提高了 13.7 个百分点，排名从 30 名开外跃升至前 5。

在这里插入图片描述
Anthropic 的工程实践则展示了在构建复杂 2D 复古游戏制作器时，采用全框架架构（Full Harness）能实现从“原型”到“生产级交付”的质变，而单智能体（Solo Agent）仅能产出无法运行的残缺品。尽管全框架开发耗时增加（6 小时 vs 20 分钟）且成本显著更高（$200 vs $9），但这种重构与测试机制确保了应用的高保真度与可运行性。

开源与商业多维度的生态布局

在 Harness 工程走向成熟的路径中，开源社区与商业大厂几乎是在同时发力。前者扮演着敏锐的探路者，负责拓展技术边界，而后者则更像务实的落地者，专注于在高并发、高合规的企业生产环境中验证其可用性。

在开源阵营，LangChain 与香港大学分别针对不同的工程痛点给出了方案。

LangChain 旗下的 DeepAgents 是专为解决复杂、多步骤及长时间运行任务而设计的智能体框架，它通过内置的任务自主规划与分解、文件系统级持久化记忆、子智能体委托协作以及跨会话的长期记忆等核心特性，有效克服了传统 Agent 在长周期任务中易丢失上下文和执行脆弱的痛点，使 AI 从简单的响应式工具进化为具备战略执行能力的复杂任务协作者。

在这里插入图片描述
由香港大学数据智能实验室（HKUDS）主导的 OpenHarness 是一个轻量级开源 Agent 基础设施框架，提供完整的工具链、技能系统、持久化记忆和多智能体协调能力，让开发者可以围绕不同后端模型快速搭建可运行的 Agent。

相比开源社区的自由与开放式探索，商业大厂的解决方案则更强调安全与开箱即用的闭环体验。

微软在 2026 年 4 月开源的 Agent Governance Toolkit，是业内首个针对 OWASP Agentic AI 十大安全风险的开源治理底座。其核心特点是能够在低于 0.1ms（P99）的极速延迟内，实现对高危或敏感操作的确定性拦截。

在这里插入图片描述

Anthropic 发布的 Claude Agent SDK（前身为 Claude Code SDK），核心在于将驱动 Claude Code 的自主循环、上下文管理和原生计算机操作能力（如文件读写、Bash 命令执行）开放为了可编程的库。它允许开发者通过 Hooks（钩子）和权限策略来拦截和控制高危工具的调用，重点在于赋予 Agent 像程序员一样操作环境以解决复杂任务的能力。

而 OpenAI 在 2026 年 4 月对 Agents SDK 进行重大升级，直接将 Harness 确立为 SDK 的核心架构概念。它通过运行框架与模型算力解耦，实现了敏感信息隔离、状态外部化快照恢复以及子智能体跨容器并行路由三大能力，并通过 Manifest 抽象层屏蔽了不同沙箱服务商的差异，原生集成了 MCP 等标准化协议。