Harness Engineering入门基础教程（非常详细），从人类写码到Agent开发，看这篇就够了！

小马不会过河

363人浏览 · 2026-04-06 18:09:00

小马不会过河 · 2026-04-06 18:09:00 发布

读完 OpenAI 关于 Harness Engineering 的文章后，我做了一份核心总结，并结合自己的项目写下了这些启发。

最近在团队里，我尝试借鉴 OpenAI 提出的 Harness Engineer 概念，探索一种新的开发模式。它的核心问题是：如果人类不手动写代码，而是由 AI Agent 完成从 PR 生成到 Review、再到集成测试的全流程，软件开发会变成什么样？

下面是我对 OpenAI 这篇文章的学习总结，以及在我自己项目中的实践与思考。

一、我学到的核心理念：人类管架构，Agent 写代码

OpenAI 提出的 Harness Engineering 重新划分了人与 AI 的职责：

人类的工作：

系统与架构设计
编写高质量的提示词（Prompt）

Agent 的工作：

根据提示词生成 Pull Request
Review PR（初期人类审核，后期可由多个 Agent 互审）
阅读 UI、日志、指标，自主判断结果是否符合预期

也就是说，人类不再盯着 IDE 逐行写代码，而是把精力放在更高层次的决策上——定义 “做什么” 和 “为什么做”，让 Agent 去完成 “怎么做”。

二、OpenAI 文章中的实现路径（我的理解与转述）

根据文章，要让 Agent 真正接手编码任务，需要建立几个关键机制：

1. doc-gardening：自动维护文档

定时扫描文档仓库，Agent 自动检测并修复过时的描述、过期的 API 示例，保持文档与代码同步。

2. AGENT.md：渐进式披露的索引

在项目根目录放一个 AGENT.md 文件，里面索引所有关键文档（Spec、Design、Plan）。Agent 按需读取，像新同事翻阅项目 Wiki，不会一次性加载过量信息。

3. 多源信息转化为 Markdown

很多关键信息不在代码库里——可能在 Google Doc、Slack 讨论、甚至人的脑子里。需要把这些信息转化为 repo 中的 Markdown 文件，让 Agent 能访问。可以把 Agent 想象成一个刚入职的同事：你不能指望它猜出之前 Slack 里达成的某个技术共识，必须把信息沉淀成文档。

三、对我的项目的启发：我现在的流程与改造计划

学完文章后，我对照了自己的现有流程，发现了明确的改进空间。

我现在的流程

给 Claude Code 写 Prompt，让它创建 Jira ticket 和 PR
人工 Review PR
在本地查看 UI 测试
查看后台是否有错误日志
验证符合需求后合并 PR

其中步骤 2-4 重复性很高，完全可以交给 Agent。

1. 让 Agent Review PR —— 需要明确标准

正确性

：逻辑是否满足需求
格式规范

：代码风格、命名、注释
架构一致性

：是否偏离既定架构
代码品味

：可读性、可维护性、是否有更优实现

初期我可以人工审核 Agent 的 Review 结果，后期可由多个 Agent 互审。

2. 让 Agent 做集成测试

目前我需要手动在本地打开 UI 验证。但大部分验证可以通过 API 层面完成：

Agent 调用后台 API，检查返回结果
UI 验证可借助 Puppeteer/Playwright，但 API 验证通过后，大部分问题已暴露
Agent 还能主动查看后台日志和 Datadog Metrics，判断异常或性能劣化

3. 处理架构偏离：让 Agent 先写文档

有时 Agent 的实现会偏离整体架构。根本原因是 Agent 没有获得完整的架构信息。

解决方案（受文章启发）：

在 AGENT.md 中给出所有文档的索引
要求 Agent 在执行任务前，先生成中间文档：

Spec

：对需求的理解
Architecture

：本功能在整体架构中的位置
Design

：具体技术设计
Plan

：分步实施计划

这些文档由 Agent 生成，我审核修正后再让它写代码。虽然多了一步，但大大减少了返工。

4. 同步外部信息：让 Agent 主动收集

很多决策发生在 Slack、Notion、Google Doc 里，代码库不知道。如何让 Agent 获取？

在 Slack 里用 @bot 命令，让 Agent 收集当前 Thread 的讨论内容，自动提交 PR 更新相关文档
支持链接 Notion doc、Google doc，Agent 定期扫描指定页面、文件夹或匹配关键词的文档
定期扫描 Slack 特定 Channel 中含有关键词的讨论，提取共识并沉淀为 Markdown

5. 创建后台 Agent 定时解决长期问题

有些问题不需要每次 PR 都关注，但需要定期处理：

架构偏移检测

：定期扫描代码，发现与架构文档不一致的地方，自动创建 ticket
技术债清理

：识别重复代码、过时依赖、性能热点，生成重构 PR

这些后台 Agent 可以定时运行（如每周一次），人类只需审核最终 PR。

四、最重要的启发：从第一天就做好架构设计

这套模式能否成功，有一个前置条件：你需要从一开始就做好系统架构设计。

这意味着在写任何代码之前，花大量时间和 AI 聊清楚需求、讨论架构方案、确定整体走向。后续所有的 Agent 执行都必须遵循这个架构。

架构不是一次成型的，但它的核心约束需要尽早确立。如果后续频繁修改架构，Agent 生成的所有代码都可能需要重写，反而得不偿失。

结语：程序员的新角色

学习 OpenAI 的 Harness Engineering 后，我最大的感受是：这并非要消灭程序员，而是重新定义我们的工作。我们不再是“写代码的人”，而是 “指挥代码生成的人”。

代码的正确性 → 由 Agent Review 保障
架构的一致性 → 由 Agent 检测
信息的同步 → 由 Agent 自动完成

人类需要做的，是设计清晰的架构，写出精准的提示词，以及——相信 Agent。

这或许就是 AI 时代的软件开发：人类负责“做什么”，Agent 负责“怎么做”。

学AI大模型的正确顺序，千万不要搞错了

🤔2026年AI风口已来！各行各业的AI渗透肉眼可见，超多公司要么转型做AI相关产品，要么高薪挖AI技术人才，机遇直接摆在眼前！

有往AI方向发展，或者本身有后端编程基础的朋友，直接冲AI大模型应用开发转岗超合适！

就算暂时不打算转岗，了解大模型、RAG、Prompt、Agent这些热门概念，能上手做简单项目，也绝对是求职加分王🔋

在这里插入图片描述

📝给大家整理了超全最新的AI大模型应用开发学习清单和资料，手把手帮你快速入门！👇👇

学习路线:

✅大模型基础认知—大模型核心原理、发展历程、主流模型（GPT、文心一言等）特点解析
✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑
✅开发基础能力—Python进阶、API接口调用、大模型开发框架（LangChain等）实操
✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用
✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代
✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经

以上6大模块，看似清晰好上手，实则每个部分都有扎实的核心内容需要吃透！

我把大模型的学习全流程已经整理📚好了！抓住AI时代风口，轻松解锁职业新可能，希望大家都能把握机遇，实现薪资/职业跃迁～

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【`保证100%免费`】

在这里插入图片描述

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

iOS 27 开放 AI 模型引爆存储新机遇@ACP#YLB3118完胜ASM1166，筑牢 AI 后端存储生态基石

AtomGit开源社区

【EI复现】基于元模型优化算法的主从博弈多虚拟电厂动态定价和能量管理(Matlab代码实现）

基于元模型的优化算法是一种基于历史数据来驱动样本点的加入从而逼近局部或全局最优解的优化机制，能够改善传统启发式智能算法需要繁复数值模拟的缺陷，目前在飞行器设计等航空航天领域的应用[20]最为广泛，在电力系统方面也有初步的应用。提出基于 Kriging 元模型的博弈均衡算法，在求解过程中建立 Kriging 元模型替代 VPP 内部的能量管理模型，利用粒子群优化算法搜索优异采样点，更新修正 Krig

AtomGit开源社区

阵列信号MUSIC算法数学模型与推导总结

MUSIC，全称 Multiple Signal Classification，的核心思想是：假设有一个由 MMM 个传感器组成的阵列，例如 MMM 个麦克风。空间中有 KKK 个远场窄带信号源，它们从不同方向到达阵列。目标是估计这 KKK 个信号源的到达方向：Θ={θ1,θ2,…,θK}\Theta = \{\theta_1, \theta_2, \dots, \theta_K\}Θ={θ1,