过去三年,AI 编程的方法论主轴经历了从 Prompt Engineering(提示词工程) → Context Engineering(上下文工程) → Harness Engineering(外壳/脚手架工程) 的三次跃迁。2026 年,业界正在向第四代范式 —— Loop Engineering(循环工程) 演进。其核心标志不再是「人类如何更好地指挥模型」,而是「模型如何自主工作(autonomous execution)并自主迭代进化(self-improving)」。本文面向专业技术人员,系统梳理这一演进的技术脉络、关键实现机制、学术前沿成果(Darwin Gödel Machine、Agentic RL、群组进化 GEA 等)与工程化案例(OpenAI Codex、Anthropic 长程应用、Hermes Agent、Self-Improving Skill 等),并对 2026–2028 的技术趋势做出研判。

核心判断:Harness 解决的是「单个 Agent 能不能持续干活」;Loop 解决的是「Agent 集群能不能自己派活、自己复盘、自己变得更强」。前者是外骨骼,后者是自驱的飞轮。Peter Steinberger(openclaw 创始人)的提醒颇具代表性 —— 别再纠结于打磨单个 coding agent,去设计能驱动 Agent 自我运转的 Loop。

一、工程范式的四次进化

理解 Loop 工程,必须把它放在 AI 编程方法论的完整演进谱系中。下表概括了四代范式的核心差异。

1.1 第一代:Prompt Engineering(提示词工程)

最早的范式核心是「如何把话说对」。围绕 zero-shot / few-shot、Chain-of-Thought(思维链)、角色扮演、输出格式约束等技巧展开。其本质局限是 单轮、无状态:模型每次对话都是孤立事件,无法跨轮次累积状态,工程能力高度依赖人的「调教技巧」,难以规模化、难以复现。

1.2 第二代:Context Engineering(上下文工程)

随着上下文窗口从 4K 扩展到 1M,重点转向 「喂什么、怎么喂」:RAG 检索增强、记忆系统(长短期记忆)、上下文压缩与摘要、相关性裁剪。其代表性洞见是 —— 即使上下文加到 1M,面对复杂长线任务模型依然会「遗忘」和「失焦」。光靠堆上下文,调教不出能稳定落地的 Agent。这直接催生了第三代。

1.3 第三代:Harness Engineering(外壳 / 脚手架工程)

Harness(直译「马具 / 挽具」)的核心隐喻是:为模型穿上一套外骨骼,让它能 7×24 小时干活而不崩溃、不烂尾。Martin Fowler、OpenAI 与 Anthropic 都对其给出了系统定义。Harness 不改变模型本身,而是在模型外部构建一整套运行基础设施。

一个完整 Harness 通常包含七大组件:① 工具箱(Tools)——文件读写、终端、检索、API 调用;② 工作环境(Workspace)——沙箱、版本控制、可回滚;③ 记忆系统(Memory)——跨会话持久化的项目记忆;④ 任务调度(Orchestration)——任务分解、子任务循环、TODO 管理;⑤ 安全边界(Guardrails)——权限控制、危险操作拦截;⑥ 监控(Observability)——执行轨迹、日志、指标;⑦ 反馈回路(Feedback Loop)——测试、Lint、CI 结果回灌给模型。

经典论断(源自 learn-claude-code):「Agency 来自模型,Agent = 模型 + Harness」。模型提供智能与自主性(Agency),Harness 提供让这种自主性得以持续、安全、可观测地落地的工程载体。Claude Code、OpenClaw、OpenAI Codex 本质上都是「模型 + Harness」的具体形态。

1.4 第四代:Loop Engineering(循环工程)

Loop 工程由 Peter Steinberger(openclaw 创始人) 明确提出,是建立在 Harness 之上的元层(meta-layer)。其分层关系是:Harness 为特定领域搭建完整的 Agent 基础设施;Loop 自动地、循环地使用整套 Harness Agent;人类只在最顶层指挥 Loop Agent。换言之,第三代里人类是「下达每个任务的工头」,第四代里人类退到「只设定目标的产品负责人」,由 Loop 负责把目标拆成任务、派给一个或多个 Harness Agent 执行、收集结果、复盘失败、调整策略、再次发起 —— 形成一个 自调度 + 自评估 + 自修正 的闭环飞轮。业界判断,沿这条路径「迈向智能,可能就在 2027 年」。

下面用一张概念图直观呈现四代范式的层级叠加关系。

图 1 AI 编程工程范式四次进化的层级叠加关系(Loop 建立在 Harness 之上)

二、Loop 工程的分层架构与控制循环

从工程实现角度看,Loop 工程可以拆解为「目标层 — 调度层 — 执行层 — 进化层」四个层次,配合一个贯穿始终的控制循环(Control Loop)。

2.1 四层结构

2.2 Loop 的核心控制循环

Loop 的运转可以抽象为一个不依赖人类逐步干预的闭环:目标设定 → 任务分解 → 调度执行(多个 Harness Agent)→ 结果验证(测试/Lint/CI)→ 失败诊断 → 经验沉淀 → 策略调整 → 重新发起。该循环的关键在于「验证」与「进化」两个环节自动化 —— 这正是它区别于第三代 Harness 的本质。

下图给出 Loop 控制循环的流程示意。

图 2 Loop 工程的自调度—自验证—自进化闭环控制流

2.3 与 Harness 的边界界定

需要特别澄清一个常见误解:Loop 不是更大的 Harness,而是 Harness 的「使用者」。Harness 关注「单个 Agent 的运行外壳」,其循环(agentic loop)是「思考—行动—观察」的微循环;Loop 关注「整个交付目标的达成」,其循环是「派活—验收—复盘—改进」的宏循环。一个 Loop 可以驱动多个异构的 Harness Agent(如一个写代码、一个写测试、一个做评审),并对它们的产出进行裁决与整合。

三、模型自主工作(Autonomous Execution)的技术实践

「自主工作」指模型在最小人类干预下,长程(long-horizon)、多步骤地推进复杂任务。其底层技术支撑主要来自三个方向。

3.1 长程 Agentic 能力与 Agentic RL

学术界已将其形式化为 Agentic Reinforcement Learning(Agentic RL)。综述论文《The Landscape of Agentic Reinforcement Learning for LLMs: A Survey》给出的定义是:把 LLM 从「静态的单步条件生成器」重新构想为「嵌入序列决策循环中的可学习策略(policy)」,使其具备 规划、推理、工具调用、记忆维护与自我改进 等长期主体性行为,从而在部分可观测、动态环境中呈现长期交互能力。

训练范式上,常用 on-policy 的 PPO 与面向可验证奖励的 RLVR(Reinforcement Learning with Verifiable Rewards)、GRPO 等。编程场景天然适合 RLVR —— 因为「代码能否通过测试」是天然的、可自动判定的奖励信号,无需人工标注偏好。

工程系统层面,2026 年出现了一批专为 Agentic RL 设计的分布式训练系统。例如港大与阿里开源的 ROLLART,基于「硬件亲和工作负载映射、轨迹级细粒度异步执行、状态感知计算」三大原则,在 3000+ 异构 GPU 集群上实现 1.35–2.05 倍 端到端训练加速,支持数百亿参数 MoE 模型训练。中科大的 Agent-R1 v2 则面向多轮任务,显著提升大模型长程规划能力。

3.2 记忆系统:从被动检索到工具化决策

长程自主工作的最大敌人是「遗忘」。新一代记忆框架 Agentic Memory(AgeMem) 把长短期记忆管理「工具化」并融入决策回路:模型不再被动接受检索结果,而是主动决定「何时记、记什么、何时取」。该框架采用 三阶段渐进式强化学习 + 分步 GRPO 解决记忆操作的稀疏奖励问题,在五大长程任务基准上同时取得更优任务性能、更高质量长期记忆与更高效上下文利用。

3.3 工程化落地:OpenAI 的规模化实证

自主工作已不止于实验室。OpenAI 在《Harness Engineering: Leveraging Codex in an Agent-First World》中披露的标志性案例:一个 3–7 人 的小团队,在 约 5 个月 内让 AI 生成了约 100 万行 生产级代码,无人手写业务逻辑 —— 人类的工作重心完全转移到了「设计 Harness、设定目标、审查产出」。这一案例被广泛视为「Agent-First 开发模式」可规模化的有力证据。

Anthropic 在《Harness Design for Long-Running Application Development》中则强调长程应用开发中的「上下文衰减管理」「子代理隔离」「检查点与回滚」等工程实践,为自主工作的稳定性提供方法论。

四、自主迭代进化(Self-Improving):从工程技巧到学术前沿

如果说「自主工作」回答的是「Agent 能不能干完」,那么「自主迭代进化」回答的是更深的问题 —— 「Agent 能不能越用越强」。这是 Loop 工程区别于此前所有范式的灵魂。本章按「轻量工程实践 → 系统级自进化 → 学术前沿(自我改写代码 / 进化算法)」三个层次展开。

4.1 层次一:轻量级自我改进(不改权重,靠记忆与反思)

最贴近当下工程落地的,是 不触碰模型权重、纯靠「外部记忆 + 元认知反思」实现的自我改进。其本质是在任务执行之上增加一层「元认知反馈环」(meta-cognitive feedback loop)。

4.1.1 Self-Improving Agent(Skill 形态)

代表作是社区广泛使用的 self-improving-agent Skill(作者 @pskoett,安装量级 10 万+)。它让 Claude Code、Codex、Copilot、OpenClaw 等编码 Agent 具备持续自我改进能力,机制为三层:

Layer 1 实时反馈循环:每次任务执行后立即评估、快速调整。

Layer 2 周期性深度反思:每周/每月深度分析,识别系统性问题。

Layer 3 记忆提升(Promote):把有价值的学习从临时 Markdown 提升到项目级记忆文件。

其触发时机设计很有借鉴价值 —— 通过 Hook 机制,在四类情况下自动捕获学习:① 被用户纠正时(识别「不对」「应该是」「这个方法已废弃」等语义);② 命令/工具执行失败时(error-detector 脚本捕获 Bash 报错);③ 遇到知识盲区时;④ 出现功能请求时。这些事件实时写入本地 Markdown,积累到阈值后再「提升」为长期记忆,使 Agent 跨 Session 不断变聪明。

4.1.2 Hermes Agent:闭环学习系统

Hermes Agent 凭借自进化能力在 OpenRouter 排行榜实现约 204% 的增速。相比 OpenClaw 的手写配置,Hermes 能自动积累经验并优化执行流程,「越用越高效」。其三大子系统协同构成闭环:Memory(记录用户偏好)+ Skill(提炼操作经验)+ Nudge Engine(定时复盘)。重要的是,它的安全设计确保了「进化可控」—— 自我改进不等于失控。

层次一的工程哲学:进化发生在「模型之外」。模型权重冻结,但 Agent 整体(模型 + 记忆 + 技能库)在持续进化。这是当前最安全、最易落地、企业可控的自进化形态。

4.2 层次二:系统级自进化与群组进化

更进一步,是在 Agent 系统层面引入进化机制,让多个 Agent 变体在竞争与选择中迭代。

GEA(群组进化范式 / Group Evolution Agent):通过维护多样化的 Agent 群体并进行进化选择,在 SWE-bench Verified 上达到 71.0%、在 Polyglot 上达到 88.3% 的解决率,显著超越单体 Agent。

EverOS(Agent Memory 自进化):以记忆为核心驱动自进化,报告称任务成功率最高提升 234.8%。

DSPy + GEPA:把提示词/程序作为可优化对象,用反思式进化(Reflective Prompt Evolution)自动搜索更优的 Agent 程序结构。

Meta HyperAgents(自指涉自我改进 / Self-referential Self-improvement):Agent 不仅改进任务策略,还改进「改进策略本身的机制」,逼近递归自我改进。

4.3 层次三:学术前沿 —— 自我改写代码与开放式进化

最激进的方向是让 Agent 直接修改自身代码,并用基准实证验证改进效果 —— 这触及了「递归自我改进(Recursive Self-Improvement, RSI)」这一通往强智能的核心命题。

4.3.1 Darwin Gödel Machine(DGM)

由 University of British Columbia、Vector Institute、Sakana AI 等机构于 2025 年 5 月提出的 Darwin Gödel Machine(DGM),是该方向的标志性成果。其核心思想融合了 Gödel Machine 的「自我改写」理念与达尔文式「开放式进化」:

自改写:Agent 能自己修改自己的代码(被形容为「心脏手术式」的自我修改)。

实证验证:每次改写后用 benchmark(如 SWE-bench)实测改进是否真实有效,而非理论证明。

多样性档案库(Archive):维护一个多样化的 Agent 档案库,从中采样、变异、保留有效个体,实现持续的开放式进化(open-ended evolution)。

DGM 用「经验性验证」替代了原始 Gödel Machine「形式化证明改进有效」的不可行要求,使递归自我改进首次具备了工程可操作性。

4.3.2 AlphaEvolve 与递归进化生态

Google 的 AlphaEvolve 将进化式代码生成应用于科学问题,据报道解决了困扰数学界数百年的「亲吻数问题(kissing number)」相关进展,证明进化式 Agent 能产出超越训练数据的新知识。从 DGM 到 OMEGA 框架,「AI 递归自我进化系统」正从理论猜想加速迈向工程化落地。资本市场亦有响应 —— 已有公司(如 Recursive Superintelligence)以「AI 研发全流程自动化」为目标完成大额融资。

下表对三个层次的自进化技术做横向对比,供选型参考。

维度 层次一 记忆/反思 层次二 系统/群组进化 层次三 自改写代码
是否改模型权重 否(改系统/策略) 否(改 Agent 代码)
代表技术 self-improving-agent、Hermes GEA、EverOS、DSPy+GEPA DGM、AlphaEvolve、OMEGA
进化粒度 记忆条目、Skill Agent 变体、提示程序 Agent 源代码
可控性/安全性 需强约束(沙箱+档案)
落地成熟度 已规模化 试验/部分开源 前沿研究
典型指标 成功率持续提升 SWE-bench 71.0% 可自我演化出更优 Agent

五、关键支撑能力:故障自愈(Self-Healing)

长程自主运行必然遭遇失败,Loop 能否持续运转,取决于其「故障自愈」能力。一个成熟的自愈机制覆盖五个阶段的全生命周期:

自愈与自进化天然耦合:每一次成功的自愈,其「失败—诊断—修复」轨迹都应被沉淀为经验,反哺到 4.1 节所述的记忆/反思层 —— 让 Agent 下次遇到同类问题时直接复用,而非重新踩坑。这正是 Loop「自验证 → 自进化」环节的具体体现。

六、工程落地的现实挑战与对策

对专业技术人员而言,理解趋势之外,更需清醒认识 Loop 工程当前的工程化障碍。

其中「奖励黑客」与「验证可信度」是自进化系统最隐蔽的风险:当 Agent 既写实现又写测试时,它可能学会「修改测试以通过」而非「修复代码」。工程上必须做到 验证主体与被验证主体的隔离,并对验证逻辑施加只读约束。

七、后续技术趋势研判(2026–2028)

7.1 范式趋势

从「写 Agent」到「写 Loop」:工程师的核心产出物从「单个 coding agent」上移为「驱动 Agent 自运转的 Loop 与验收契约」。人的价值集中在目标定义、验证标准设计与边界约束。

RLVR + Agentic RL 成为模型侧主线:可验证奖励让编程、数学、工具使用等领域的长程能力持续提升,模型自身的「自主性(Agency)」越来越强,对外部 Harness 的依赖会相对下降。

自进化从「外部记忆」走向「系统/代码自改写」:层次一已规模化,层次二在快速开源化,层次三(DGM 类)将从研究走向受控的生产试点。

7.2 工程趋势

记忆即基础设施:Agentic Memory 这类「工具化、可决策」的记忆系统将成为标配,记忆质量直接决定进化上限。

评估/验证基础设施崛起:谁掌握高质量、防作弊的自动验证体系,谁就掌握自进化的方向盘 —— 验证基础设施的重要性将不亚于训练基础设施。

多 Agent 编排标准化:Loop 调度层将出现类似「Agent 操作系统」的标准化框架,统一任务、记忆、工具、安全的接口。

学AI大模型的正确顺序,千万不要搞错了

🤔2026年AI风口已来!各行各业的AI渗透肉眼可见,超多公司要么转型做AI相关产品,要么高薪挖AI技术人才,机遇直接摆在眼前!

有往AI方向发展,或者本身有后端编程基础的朋友,直接冲AI大模型应用开发转岗超合适!

就算暂时不打算转岗,了解大模型、RAG、Prompt、Agent这些热门概念,能上手做简单项目,也绝对是求职加分王🔋

在这里插入图片描述

📝给大家整理了超全最新的AI大模型应用开发学习清单和资料,手把手帮你快速入门!👇👇

学习路线:

✅大模型基础认知—大模型核心原理、发展历程、主流模型(GPT、文心一言等)特点解析
✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑
✅开发基础能力—Python进阶、API接口调用、大模型开发框架(LangChain等)实操
✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用
✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代
✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经

以上6大模块,看似清晰好上手,实则每个部分都有扎实的核心内容需要吃透!

我把大模型的学习全流程已经整理📚好了!抓住AI时代风口,轻松解锁职业新可能,希望大家都能把握机遇,实现薪资/职业跃迁~

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

在这里插入图片描述

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐