从 Harness 工程到 Loop 工程-模型自主工作与自主迭代进化探索

小天才学习机打游戏

21人浏览 · 2026-06-15 20:51:06

小天才学习机打游戏 · 2026-06-15 20:51:06 发布

过去三年，AI 编程的方法论主轴经历了从 Prompt Engineering（提示词工程） → Context Engineering（上下文工程） → Harness Engineering（外壳/脚手架工程）的三次跃迁。2026 年，业界正在向第四代范式 —— Loop Engineering（循环工程）演进。其核心标志不再是「人类如何更好地指挥模型」，而是「模型如何自主工作（autonomous execution）并自主迭代进化（self-improving）」。本文面向专业技术人员，系统梳理这一演进的技术脉络、关键实现机制、学术前沿成果（Darwin Gödel Machine、Agentic RL、群组进化 GEA 等）与工程化案例（OpenAI Codex、Anthropic 长程应用、Hermes Agent、Self-Improving Skill 等），并对 2026–2028 的技术趋势做出研判。

核心判断：Harness 解决的是「单个 Agent 能不能持续干活」；Loop 解决的是「Agent 集群能不能自己派活、自己复盘、自己变得更强」。前者是外骨骼，后者是自驱的飞轮。Peter Steinberger（openclaw 创始人）的提醒颇具代表性 —— 别再纠结于打磨单个 coding agent，去设计能驱动 Agent 自我运转的 Loop。

一、工程范式的四次进化

理解 Loop 工程，必须把它放在 AI 编程方法论的完整演进谱系中。下表概括了四代范式的核心差异。

1.1 第一代：Prompt Engineering（提示词工程）

最早的范式核心是「如何把话说对」。围绕 zero-shot / few-shot、Chain-of-Thought（思维链）、角色扮演、输出格式约束等技巧展开。其本质局限是单轮、无状态：模型每次对话都是孤立事件，无法跨轮次累积状态，工程能力高度依赖人的「调教技巧」，难以规模化、难以复现。

1.2 第二代：Context Engineering（上下文工程）

随着上下文窗口从 4K 扩展到 1M，重点转向「喂什么、怎么喂」：RAG 检索增强、记忆系统（长短期记忆）、上下文压缩与摘要、相关性裁剪。其代表性洞见是 —— 即使上下文加到 1M，面对复杂长线任务模型依然会「遗忘」和「失焦」。光靠堆上下文，调教不出能稳定落地的 Agent。这直接催生了第三代。

1.3 第三代：Harness Engineering（外壳 / 脚手架工程）

Harness（直译「马具 / 挽具」）的核心隐喻是：为模型穿上一套外骨骼，让它能 7×24 小时干活而不崩溃、不烂尾。Martin Fowler、OpenAI 与 Anthropic 都对其给出了系统定义。Harness 不改变模型本身，而是在模型外部构建一整套运行基础设施。

一个完整 Harness 通常包含七大组件：① 工具箱（Tools）——文件读写、终端、检索、API 调用；② 工作环境（Workspace）——沙箱、版本控制、可回滚；③ 记忆系统（Memory）——跨会话持久化的项目记忆；④ 任务调度（Orchestration）——任务分解、子任务循环、TODO 管理；⑤ 安全边界（Guardrails）——权限控制、危险操作拦截；⑥ 监控（Observability）——执行轨迹、日志、指标；⑦ 反馈回路（Feedback Loop）——测试、Lint、CI 结果回灌给模型。

经典论断（源自 learn-claude-code）：「Agency 来自模型，Agent = 模型 + Harness」。模型提供智能与自主性（Agency），Harness 提供让这种自主性得以持续、安全、可观测地落地的工程载体。Claude Code、OpenClaw、OpenAI Codex 本质上都是「模型 + Harness」的具体形态。

1.4 第四代：Loop Engineering（循环工程）

Loop 工程由 Peter Steinberger（openclaw 创始人）明确提出，是建立在 Harness 之上的元层（meta-layer）。其分层关系是：Harness 为特定领域搭建完整的 Agent 基础设施；Loop 自动地、循环地使用整套 Harness Agent；人类只在最顶层指挥 Loop Agent。换言之，第三代里人类是「下达每个任务的工头」，第四代里人类退到「只设定目标的产品负责人」，由 Loop 负责把目标拆成任务、派给一个或多个 Harness Agent 执行、收集结果、复盘失败、调整策略、再次发起 —— 形成一个自调度 + 自评估 + 自修正的闭环飞轮。业界判断，沿这条路径「迈向智能，可能就在 2027 年」。

下面用一张概念图直观呈现四代范式的层级叠加关系。

图 1　AI 编程工程范式四次进化的层级叠加关系（Loop 建立在 Harness 之上）

二、Loop 工程的分层架构与控制循环

从工程实现角度看，Loop 工程可以拆解为「目标层 — 调度层 — 执行层 — 进化层」四个层次，配合一个贯穿始终的控制循环（Control Loop）。

2.1 四层结构

2.2 Loop 的核心控制循环

Loop 的运转可以抽象为一个不依赖人类逐步干预的闭环：目标设定 → 任务分解 → 调度执行（多个 Harness Agent）→ 结果验证（测试/Lint/CI）→ 失败诊断 → 经验沉淀 → 策略调整 → 重新发起。该循环的关键在于「验证」与「进化」两个环节自动化 —— 这正是它区别于第三代 Harness 的本质。

下图给出 Loop 控制循环的流程示意。

图 2　Loop 工程的自调度—自验证—自进化闭环控制流

2.3 与 Harness 的边界界定

需要特别澄清一个常见误解：Loop 不是更大的 Harness，而是 Harness 的「使用者」。Harness 关注「单个 Agent 的运行外壳」，其循环（agentic loop）是「思考—行动—观察」的微循环；Loop 关注「整个交付目标的达成」，其循环是「派活—验收—复盘—改进」的宏循环。一个 Loop 可以驱动多个异构的 Harness Agent（如一个写代码、一个写测试、一个做评审），并对它们的产出进行裁决与整合。

三、模型自主工作（Autonomous Execution）的技术实践

「自主工作」指模型在最小人类干预下，长程（long-horizon）、多步骤地推进复杂任务。其底层技术支撑主要来自三个方向。

3.1 长程 Agentic 能力与 Agentic RL

学术界已将其形式化为 Agentic Reinforcement Learning（Agentic RL）。综述论文《The Landscape of Agentic Reinforcement Learning for LLMs: A Survey》给出的定义是：把 LLM 从「静态的单步条件生成器」重新构想为「嵌入序列决策循环中的可学习策略（policy）」，使其具备规划、推理、工具调用、记忆维护与自我改进等长期主体性行为，从而在部分可观测、动态环境中呈现长期交互能力。

训练范式上，常用 on-policy 的 PPO 与面向可验证奖励的 RLVR（Reinforcement Learning with Verifiable Rewards）、GRPO 等。编程场景天然适合 RLVR —— 因为「代码能否通过测试」是天然的、可自动判定的奖励信号，无需人工标注偏好。

工程系统层面，2026 年出现了一批专为 Agentic RL 设计的分布式训练系统。例如港大与阿里开源的 ROLLART，基于「硬件亲和工作负载映射、轨迹级细粒度异步执行、状态感知计算」三大原则，在 3000+ 异构 GPU 集群上实现 1.35–2.05 倍端到端训练加速，支持数百亿参数 MoE 模型训练。中科大的 Agent-R1 v2 则面向多轮任务，显著提升大模型长程规划能力。

3.2 记忆系统：从被动检索到工具化决策

长程自主工作的最大敌人是「遗忘」。新一代记忆框架 Agentic Memory（AgeMem）把长短期记忆管理「工具化」并融入决策回路：模型不再被动接受检索结果，而是主动决定「何时记、记什么、何时取」。该框架采用三阶段渐进式强化学习 + 分步 GRPO 解决记忆操作的稀疏奖励问题，在五大长程任务基准上同时取得更优任务性能、更高质量长期记忆与更高效上下文利用。

3.3 工程化落地：OpenAI 的规模化实证

自主工作已不止于实验室。OpenAI 在《Harness Engineering: Leveraging Codex in an Agent-First World》中披露的标志性案例：一个 3–7 人的小团队，在约 5 个月内让 AI 生成了约 100 万行生产级代码，无人手写业务逻辑 —— 人类的工作重心完全转移到了「设计 Harness、设定目标、审查产出」。这一案例被广泛视为「Agent-First 开发模式」可规模化的有力证据。

Anthropic 在《Harness Design for Long-Running Application Development》中则强调长程应用开发中的「上下文衰减管理」「子代理隔离」「检查点与回滚」等工程实践，为自主工作的稳定性提供方法论。

四、自主迭代进化（Self-Improving）：从工程技巧到学术前沿

如果说「自主工作」回答的是「Agent 能不能干完」，那么「自主迭代进化」回答的是更深的问题 —— 「Agent 能不能越用越强」。这是 Loop 工程区别于此前所有范式的灵魂。本章按「轻量工程实践 → 系统级自进化 → 学术前沿（自我改写代码 / 进化算法）」三个层次展开。

4.1 层次一：轻量级自我改进（不改权重，靠记忆与反思）

最贴近当下工程落地的，是不触碰模型权重、纯靠「外部记忆 + 元认知反思」实现的自我改进。其本质是在任务执行之上增加一层「元认知反馈环」（meta-cognitive feedback loop）。

4.1.1 Self-Improving Agent（Skill 形态）

代表作是社区广泛使用的 self-improving-agent Skill（作者 @pskoett，安装量级 10 万+）。它让 Claude Code、Codex、Copilot、OpenClaw 等编码 Agent 具备持续自我改进能力，机制为三层：

Layer 1 实时反馈循环：每次任务执行后立即评估、快速调整。

Layer 2 周期性深度反思：每周/每月深度分析，识别系统性问题。

Layer 3 记忆提升（Promote）：把有价值的学习从临时 Markdown 提升到项目级记忆文件。

其触发时机设计很有借鉴价值 —— 通过 Hook 机制，在四类情况下自动捕获学习：① 被用户纠正时（识别「不对」「应该是」「这个方法已废弃」等语义）；② 命令/工具执行失败时（error-detector 脚本捕获 Bash 报错）；③ 遇到知识盲区时；④ 出现功能请求时。这些事件实时写入本地 Markdown，积累到阈值后再「提升」为长期记忆，使 Agent 跨 Session 不断变聪明。

4.1.2 Hermes Agent：闭环学习系统

Hermes Agent 凭借自进化能力在 OpenRouter 排行榜实现约 204% 的增速。相比 OpenClaw 的手写配置，Hermes 能自动积累经验并优化执行流程，「越用越高效」。其三大子系统协同构成闭环：Memory（记录用户偏好）+ Skill（提炼操作经验）+ Nudge Engine（定时复盘）。重要的是，它的安全设计确保了「进化可控」—— 自我改进不等于失控。

层次一的工程哲学：进化发生在「模型之外」。模型权重冻结，但 Agent 整体（模型 + 记忆 + 技能库）在持续进化。这是当前最安全、最易落地、企业可控的自进化形态。

4.2 层次二：系统级自进化与群组进化

更进一步，是在 Agent 系统层面引入进化机制，让多个 Agent 变体在竞争与选择中迭代。

GEA（群组进化范式 / Group Evolution Agent）：通过维护多样化的 Agent 群体并进行进化选择，在 SWE-bench Verified 上达到 71.0%、在 Polyglot 上达到 88.3% 的解决率，显著超越单体 Agent。

EverOS（Agent Memory 自进化）：以记忆为核心驱动自进化，报告称任务成功率最高提升 234.8%。

DSPy + GEPA：把提示词/程序作为可优化对象，用反思式进化（Reflective Prompt Evolution）自动搜索更优的 Agent 程序结构。

Meta HyperAgents（自指涉自我改进 / Self-referential Self-improvement）：Agent 不仅改进任务策略，还改进「改进策略本身的机制」，逼近递归自我改进。

4.3 层次三：学术前沿 —— 自我改写代码与开放式进化

最激进的方向是让 Agent 直接修改自身代码，并用基准实证验证改进效果 —— 这触及了「递归自我改进（Recursive Self-Improvement, RSI）」这一通往强智能的核心命题。

4.3.1 Darwin Gödel Machine（DGM）

由 University of British Columbia、Vector Institute、Sakana AI 等机构于 2025 年 5 月提出的 Darwin Gödel Machine（DGM），是该方向的标志性成果。其核心思想融合了 Gödel Machine 的「自我改写」理念与达尔文式「开放式进化」：

自改写：Agent 能自己修改自己的代码（被形容为「心脏手术式」的自我修改）。

实证验证：每次改写后用 benchmark（如 SWE-bench）实测改进是否真实有效，而非理论证明。

多样性档案库（Archive）：维护一个多样化的 Agent 档案库，从中采样、变异、保留有效个体，实现持续的开放式进化（open-ended evolution）。

DGM 用「经验性验证」替代了原始 Gödel Machine「形式化证明改进有效」的不可行要求，使递归自我改进首次具备了工程可操作性。

4.3.2 AlphaEvolve 与递归进化生态

Google 的 AlphaEvolve 将进化式代码生成应用于科学问题，据报道解决了困扰数学界数百年的「亲吻数问题（kissing number）」相关进展，证明进化式 Agent 能产出超越训练数据的新知识。从 DGM 到 OMEGA 框架，「AI 递归自我进化系统」正从理论猜想加速迈向工程化落地。资本市场亦有响应 —— 已有公司（如 Recursive Superintelligence）以「AI 研发全流程自动化」为目标完成大额融资。

下表对三个层次的自进化技术做横向对比，供选型参考。


维度	层次一记忆/反思	层次二系统/群组进化	层次三自改写代码
是否改模型权重	否	否（改系统/策略）	否（改 Agent 代码）
代表技术	self-improving-agent、Hermes	GEA、EverOS、DSPy+GEPA	DGM、AlphaEvolve、OMEGA
进化粒度	记忆条目、Skill	Agent 变体、提示程序	Agent 源代码
可控性/安全性	高	中	需强约束（沙箱+档案）
落地成熟度	已规模化	试验/部分开源	前沿研究
典型指标	成功率持续提升	SWE-bench 71.0%	可自我演化出更优 Agent

五、关键支撑能力：故障自愈（Self-Healing）

长程自主运行必然遭遇失败，Loop 能否持续运转，取决于其「故障自愈」能力。一个成熟的自愈机制覆盖五个阶段的全生命周期：

自愈与自进化天然耦合：每一次成功的自愈，其「失败—诊断—修复」轨迹都应被沉淀为经验，反哺到 4.1 节所述的记忆/反思层 —— 让 Agent 下次遇到同类问题时直接复用，而非重新踩坑。这正是 Loop「自验证 → 自进化」环节的具体体现。

六、工程落地的现实挑战与对策

对专业技术人员而言，理解趋势之外，更需清醒认识 Loop 工程当前的工程化障碍。

其中「奖励黑客」与「验证可信度」是自进化系统最隐蔽的风险：当 Agent 既写实现又写测试时，它可能学会「修改测试以通过」而非「修复代码」。工程上必须做到验证主体与被验证主体的隔离，并对验证逻辑施加只读约束。

七、后续技术趋势研判（2026–2028）

7.1 范式趋势

从「写 Agent」到「写 Loop」：工程师的核心产出物从「单个 coding agent」上移为「驱动 Agent 自运转的 Loop 与验收契约」。人的价值集中在目标定义、验证标准设计与边界约束。

RLVR + Agentic RL 成为模型侧主线：可验证奖励让编程、数学、工具使用等领域的长程能力持续提升，模型自身的「自主性（Agency）」越来越强，对外部 Harness 的依赖会相对下降。

自进化从「外部记忆」走向「系统/代码自改写」：层次一已规模化，层次二在快速开源化，层次三（DGM 类）将从研究走向受控的生产试点。

7.2 工程趋势

记忆即基础设施：Agentic Memory 这类「工具化、可决策」的记忆系统将成为标配，记忆质量直接决定进化上限。

评估/验证基础设施崛起：谁掌握高质量、防作弊的自动验证体系，谁就掌握自进化的方向盘 —— 验证基础设施的重要性将不亚于训练基础设施。

多 Agent 编排标准化：Loop 调度层将出现类似「Agent 操作系统」的标准化框架，统一任务、记忆、工具、安全的接口。

学AI大模型的正确顺序，千万不要搞错了

🤔2026年AI风口已来！各行各业的AI渗透肉眼可见，超多公司要么转型做AI相关产品，要么高薪挖AI技术人才，机遇直接摆在眼前！

有往AI方向发展，或者本身有后端编程基础的朋友，直接冲AI大模型应用开发转岗超合适！

就算暂时不打算转岗，了解大模型、RAG、Prompt、Agent这些热门概念，能上手做简单项目，也绝对是求职加分王🔋

在这里插入图片描述

📝给大家整理了超全最新的AI大模型应用开发学习清单和资料，手把手帮你快速入门！👇👇

学习路线:

✅大模型基础认知—大模型核心原理、发展历程、主流模型（GPT、文心一言等）特点解析
✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑
✅开发基础能力—Python进阶、API接口调用、大模型开发框架（LangChain等）实操
✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用
✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代
✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经

以上6大模块，看似清晰好上手，实则每个部分都有扎实的核心内容需要吃透！

我把大模型的学习全流程已经整理📚好了！抓住AI时代风口，轻松解锁职业新可能，希望大家都能把握机遇，实现薪资/职业跃迁～

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【`保证100%免费`】

在这里插入图片描述

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

Web Fuzzer 可视化 Web 模糊测试工具

Web Fuzzer 是 Yakit 平台的可视化模糊测试核心模块，以 FuzzTag 标签语法为核心，天然整合 Repeater 与 Intruder 功能，实现批量发包、热加载脚本、多协议反连的一体化操作，是 BurpSuite Intruder 的免费开源替代方案，且深度集成于 Yaklang/CDSL 安全能力生态。