Agent 时代的工程范式跃迁:从 Prompt 到 Harness
摘要:底层模型决定智能上限,而包裹在其外层的 Agent Harness(运行骨架)则直接决定系统在真实生产环境中的落地成败。
在许多团队试图让大模型跑通端到端业务时,经常会遇到难以逾越的工程瓶颈。例如让 AI 修复一个复杂的开源库 Bug,它们往往会在连续执行多步操作后,因为一次微小的工具超时、文件锁冲突或者模型输出格式走样,导致整个长链路任务瞬间溃散、无法恢复。这并非底层模型的推理算力不够强,而是系统缺乏能够在长周期、高动态环境下兜底的可靠骨架。
为了解决这种多步执行在工程上的脆弱性,业界正在悄然发生一场“重构外壳”的范式革命。人们开始意识到,必须为无状态的大模型搭配一套能够感知、隔离并能够自动纠错的运行骨架,从而引出了当前重塑整个 AI 基础设计的核心概念——Agent Harness。它为模型提供了长效运行的基础设施与安全操作系统,正成为让智能真正平稳落地的关键力量。
什么是 Agent Harness?
在传统的软件工程中,硬件与应用之间必须有操作系统的存在。如果用计算机系统架构来做类比,现代 AI 系统的层级关系可以得到非常直观的理解:
大语言模型就像是 CPU,负责提供最基本的推理与计算算力,但它本身是没有状态的,无法直接独立运行;上下文窗口则是 RAM,负责提供临时的、易失的高带宽工作内存,用来存储对话中转的状态;而 Agent Harness 则是操作系统(OS),它为模型提供了运行所需的基础设施、安全壁垒、控制回路与网络连接;最后,特定的业务 Agent 则是跑在操作系统上的应用程序。
简而言之,Agent Harness 就是包裹在基础大模型外层的一切代码、配置和运行时环境的总和。大模型负责输出智能,而 Harness 则负责提供让这种智能安全落地、稳定运行并可与现实世界安全交互的系统支撑。

从 Prompt 到 Harness
回顾 AI 落地应用的技术演进,整个工程界的关注重心在过去几年里经历了三次深刻的底层迁移。最初,人们将所有期望寄托于如何向模型提问,通过调试提示词以榨取单次输出潜能,诞生了 Prompt Engineering;随后,随着长上下文窗口和检索技术的成熟,工程重点转向了 Context Engineering,聚焦在如何精准压缩、提取并输入有效上下文。而到了 2026 年,系统如何在真实物理世界中实现无人工干预的闭环运转,推动行业进入 Harness Engineering 时代。

在这一轮由应用边界倒逼的进化中,行业的发展轴线由几个里程碑式的时间节点连缀而成:
在 2025 年 11 月,Anthropic 发布工程博客《Effective harnesses for long-running agents》,系统性地阐述了如何通过 Agent Harness 的设计来解决长周期任务中的失忆与漂移问题。
随后在 2026 年 2 月 5 日,HashiCorp 联合创始人 Mitchell Hashimoto 发表博客《My AI Adoption Journey》,首次提出了 Harness Engineering 的工作方法。他强调每当 Agent 在执行任务时犯错,不要只做一次性修复,而是工程化地构建一套防止同类错误重犯的机制。
紧接着在 2026 年 2 月 11 日,OpenAI 发表博文《Harness engineering: leveraging Codex in an agent-first world》,深度总结了其在利用 Codex 智能体进行“零人工代码”生产实验。团队通过在 Harness 层引入完整的本地可观测性监控和严格单向分层架构约束,保证了 3 到 7 人团队在 5 个月内驱动 Codex 完成了约 1500 个 PR 的生成与合并,验证了闭环 Harness 工程的强悍力量。
而在 2026 年 5 月,学术界发布了长达 70 多页的首篇 Agent Harness 综述论文《Agent Harness Engineering: A Survey》。这一事件标志着一线工业界的工程探索,已经正式被学术界梳理并沉淀为行业共识,Harness Engineering 也由此成为了一门独立的学科体系。
Harness 的七层架构体系
随着 Agent 从玩具走向严肃的生产环境,业界开始对这套 Harness 工程进行系统性总结。2026 年 5 月发表在 OpenReview 上的全景综述论文《Agent Harness Engineering: A Survey》,首次提出了 ETCLOVG 七层架构体系。这七层架构规范了智能体运行时骨架的每一个设计维度:
1. E (Execution) 执行环境
决定 Agent 运行的物理与安全边界,同时承担安全隔离、可复现性和存活度三重职责。论文将当前沙箱生态划分为七类:通用托管沙箱、计算机使用环境、代码专用沙箱、框架内置运行时、浏览器评测环境、操作系统级权限沙箱,以及沙箱抽象层。
2. T (Tool) 工具接口
解决 Agent 如何发现、描述和调用外部能力。生产实践表明暴露过多工具不仅会增加上下文成本,也会导致可靠性下降。其中,MCP、A2A、Function Calling 和 AGENTS.md 用于解决不同层面的接口问题。
3. C (Context) 上下文与记忆
管理模型在每个执行步骤能看到的信息。更大的窗口不等于更好的记忆。论文将上下文管理按时间尺度分为三层:短期(KV 缓存感知设计、渐进式披露等)、中期(会话级持久化)、长期(跨会话可检索的持久记忆存储)。
4. L (Lifecycle) 生命周期与编排
管理单 Agent 内循环、多 Agent 编排模式以及从 Issue 到 Pull Request 的全生命周期流水线。论文将当前编排系统分为三类执行模型:无状态回放(Codex CLI 式,每次从头构建上下文)、有状态(维护协调状态、角色分配、任务图),以及混合型。
5. O (Observability) 可观测性
全面监控 Agent 长链路执行,将每次模型调用、工具执行、检索步骤记录为可检查的 trace,支撑故障诊断、成本核算与可靠性工程。论文提出了“Harness 即假设”原则——理想的可观测系统不仅要检测 Agent 何时失败,还要检测哪些 Harness 组件已经变成不必要的开销。
6. V (Verification) 验证与评估
将 Agent 行为转化为可诊断的工程证据,论文将其组织为一个五阶段的“任务到反馈”生命周期:任务与基准测试对齐、执行前准备检查、受控执行、多级判断(结果层、轨迹层、评估器层)与故障归因以及持续回归与部署反馈。
7. G (Governance) 治理与安全
约束 Agent 行为的权限边界,通过权限模型与身份管理、生命周期钩子、组件加固、声明式宪法、审计基础设施等机制,建立从人类到 Agent 的可追溯安全与问责链。

只换 Harness 不换模型
在许多团队纠结于使用 7B 模型还是 70B 模型时,工业界的实验数据已经给出了一个令人振奋的结论:只换运行时 Harness,不换任何底层大模型,就能让 AI 系统的最终表现产生质的飞跃。
LangChain 官方在最近的 Terminal-Bench 2.0 评测中进行了一次极具说服力的对照实验。他们使用完全相同的底层大语言模型,仅仅对其外层的运行时 Harness 进行了工程重构,结果其复杂长周期任务的成功率直接从原先的 52.8% 跃升至 66.5%,足足提高了 13.7 个百分点,排名从 30 名开外跃升至前 5。

Anthropic 的工程实践则展示了在构建复杂 2D 复古游戏制作器时,采用全框架架构(Full Harness)能实现从“原型”到“生产级交付”的质变,而单智能体(Solo Agent)仅能产出无法运行的残缺品。尽管全框架开发耗时增加(6 小时 vs 20 分钟)且成本显著更高($200 vs $9),但这种重构与测试机制确保了应用的高保真度与可运行性。
开源与商业多维度的生态布局
在 Harness 工程走向成熟的路径中,开源社区与商业大厂几乎是在同时发力。前者扮演着敏锐的探路者,负责拓展技术边界,而后者则更像务实的落地者,专注于在高并发、高合规的企业生产环境中验证其可用性。
在开源阵营,LangChain 与香港大学分别针对不同的工程痛点给出了方案。
LangChain 旗下的 DeepAgents 是专为解决复杂、多步骤及长时间运行任务而设计的智能体框架,它通过内置的任务自主规划与分解、文件系统级持久化记忆、子智能体委托协作以及跨会话的长期记忆等核心特性,有效克服了传统 Agent 在长周期任务中易丢失上下文和执行脆弱的痛点,使 AI 从简单的响应式工具进化为具备战略执行能力的复杂任务协作者。

由香港大学数据智能实验室(HKUDS)主导的 OpenHarness 是一个轻量级开源 Agent 基础设施框架,提供完整的工具链、技能系统、持久化记忆和多智能体协调能力,让开发者可以围绕不同后端模型快速搭建可运行的 Agent。
相比开源社区的自由与开放式探索,商业大厂的解决方案则更强调安全与开箱即用的闭环体验。
微软在 2026 年 4 月开源的 Agent Governance Toolkit,是业内首个针对 OWASP Agentic AI 十大安全风险的开源治理底座。其核心特点是能够在低于 0.1ms(P99) 的极速延迟内,实现对高危或敏感操作的确定性拦截。

Anthropic 发布的 Claude Agent SDK(前身为 Claude Code SDK),核心在于将驱动 Claude Code 的自主循环、上下文管理和原生计算机操作能力(如文件读写、Bash 命令执行) 开放为了可编程的库。它允许开发者通过 Hooks(钩子)和权限策略来拦截和控制高危工具的调用,重点在于赋予 Agent 像程序员一样操作环境以解决复杂任务的能力。
而 OpenAI 在 2026 年 4 月对 Agents SDK 进行重大升级,直接将 Harness 确立为 SDK 的核心架构概念。它通过运行框架与模型算力解耦,实现了敏感信息隔离、状态外部化快照恢复以及子智能体跨容器并行路由三大能力,并通过 Manifest 抽象层屏蔽了不同沙箱服务商的差异,原生集成了 MCP 等标准化协议。
系统演进的核心与未来
在 2026 年,大模型的能力红利正在走向平权与商品化。底层的算力基建已经逐渐拉平,光靠在前端优化几句精美的 Prompt,已经无法在红海应用中拉开代际差距,AI 竞争的核心竞争维度正在加速向 Harness Engineering 转移。
未来,如何围绕无状态的模型智能,构建一套健壮、安全、可自我验证且具备高弹性自修复能力的运行时操作系统,才是决定 AI Agent 真正走向商业落地、并帮助企业构筑起底层行业护城河的核心武器。
相关资源
Anthropic 工程博客
Mitchell Hashimoto 博客
OpenAI 工程博客
ETCLOVG 综述论文项目主页
Awesome-Agent-Harness 整理库
学术综述 PDF
LangChain Terminal-Bench 2.0 拆解
OpenHarness(港大)
Agent Governance Toolkit(微软)
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐



所有评论(0)