读完 OpenAI 关于 Harness Engineering 的文章后,我做了一份核心总结,并结合自己的项目写下了这些启发。

最近在团队里,我尝试借鉴 OpenAI 提出的 Harness Engineer 概念,探索一种新的开发模式。它的核心问题是:如果人类不手动写代码,而是由 AI Agent 完成从 PR 生成到 Review、再到集成测试的全流程,软件开发会变成什么样?

下面是我对 OpenAI 这篇文章的学习总结,以及在我自己项目中的实践与思考。

一、我学到的核心理念:人类管架构,Agent 写代码

OpenAI 提出的 Harness Engineering 重新划分了人与 AI 的职责:

人类的工作:

  • 系统与架构设计
  • 编写高质量的提示词(Prompt)

Agent 的工作:

  1. 根据提示词生成 Pull Request
  2. Review PR(初期人类审核,后期可由多个 Agent 互审)
  3. 阅读 UI、日志、指标,自主判断结果是否符合预期

也就是说,人类不再盯着 IDE 逐行写代码,而是把精力放在更高层次的决策上——定义 “做什么”“为什么做”,让 Agent 去完成 “怎么做”

二、OpenAI 文章中的实现路径(我的理解与转述)

根据文章,要让 Agent 真正接手编码任务,需要建立几个关键机制:

1. doc-gardening:自动维护文档

定时扫描文档仓库,Agent 自动检测并修复过时的描述、过期的 API 示例,保持文档与代码同步。

2. AGENT.md:渐进式披露的索引

在项目根目录放一个 AGENT.md 文件,里面索引所有关键文档(Spec、Design、Plan)。Agent 按需读取,像新同事翻阅项目 Wiki,不会一次性加载过量信息。

3. 多源信息转化为 Markdown

很多关键信息不在代码库里——可能在 Google Doc、Slack 讨论、甚至人的脑子里。需要把这些信息转化为 repo 中的 Markdown 文件,让 Agent 能访问。可以把 Agent 想象成一个刚入职的同事:你不能指望它猜出之前 Slack 里达成的某个技术共识,必须把信息沉淀成文档。

三、对我的项目的启发:我现在的流程与改造计划

学完文章后,我对照了自己的现有流程,发现了明确的改进空间。

我现在的流程

  1. 给 Claude Code 写 Prompt,让它创建 Jira ticket 和 PR
  2. 人工 Review PR
  3. 在本地查看 UI 测试
  4. 查看后台是否有错误日志
  5. 验证符合需求后合并 PR

其中步骤 2-4 重复性很高,完全可以交给 Agent。

1. 让 Agent Review PR —— 需要明确标准

  • 正确性

    :逻辑是否满足需求

  • 格式规范

    :代码风格、命名、注释

  • 架构一致性

    :是否偏离既定架构

  • 代码品味

    :可读性、可维护性、是否有更优实现

初期我可以人工审核 Agent 的 Review 结果,后期可由多个 Agent 互审。

2. 让 Agent 做集成测试

目前我需要手动在本地打开 UI 验证。但大部分验证可以通过 API 层面完成:

  • Agent 调用后台 API,检查返回结果
  • UI 验证可借助 Puppeteer/Playwright,但 API 验证通过后,大部分问题已暴露
  • Agent 还能主动查看后台日志和 Datadog Metrics,判断异常或性能劣化

3. 处理架构偏离:让 Agent 先写文档

有时 Agent 的实现会偏离整体架构。根本原因是 Agent 没有获得完整的架构信息

解决方案(受文章启发):

  • AGENT.md 中给出所有文档的索引
  • 要求 Agent 在执行任务前,先生成中间文档:
  • Spec

    :对需求的理解

  • Architecture

    :本功能在整体架构中的位置

  • Design

    :具体技术设计

  • Plan

    :分步实施计划

这些文档由 Agent 生成,我审核修正后再让它写代码。虽然多了一步,但大大减少了返工。

4. 同步外部信息:让 Agent 主动收集

很多决策发生在 Slack、Notion、Google Doc 里,代码库不知道。如何让 Agent 获取?

  • 在 Slack 里用 @bot 命令,让 Agent 收集当前 Thread 的讨论内容,自动提交 PR 更新相关文档
  • 支持链接 Notion doc、Google doc,Agent 定期扫描指定页面、文件夹或匹配关键词的文档
  • 定期扫描 Slack 特定 Channel 中含有关键词的讨论,提取共识并沉淀为 Markdown

5. 创建后台 Agent 定时解决长期问题

有些问题不需要每次 PR 都关注,但需要定期处理:

  • 架构偏移检测

    :定期扫描代码,发现与架构文档不一致的地方,自动创建 ticket

  • 技术债清理

    :识别重复代码、过时依赖、性能热点,生成重构 PR

这些后台 Agent 可以定时运行(如每周一次),人类只需审核最终 PR。

四、最重要的启发:从第一天就做好架构设计

这套模式能否成功,有一个前置条件:你需要从一开始就做好系统架构设计

这意味着在写任何代码之前,花大量时间和 AI 聊清楚需求、讨论架构方案、确定整体走向。后续所有的 Agent 执行都必须遵循这个架构。

架构不是一次成型的,但它的核心约束需要尽早确立。如果后续频繁修改架构,Agent 生成的所有代码都可能需要重写,反而得不偿失。

结语:程序员的新角色

学习 OpenAI 的 Harness Engineering 后,我最大的感受是:这并非要消灭程序员,而是重新定义我们的工作。我们不再是“写代码的人”,而是 “指挥代码生成的人”

  • 代码的正确性 → 由 Agent Review 保障
  • 架构的一致性 → 由 Agent 检测
  • 信息的同步 → 由 Agent 自动完成

人类需要做的,是设计清晰的架构,写出精准的提示词,以及——相信 Agent

这或许就是 AI 时代的软件开发:人类负责“做什么”,Agent 负责“怎么做”

学AI大模型的正确顺序,千万不要搞错了

🤔2026年AI风口已来!各行各业的AI渗透肉眼可见,超多公司要么转型做AI相关产品,要么高薪挖AI技术人才,机遇直接摆在眼前!

有往AI方向发展,或者本身有后端编程基础的朋友,直接冲AI大模型应用开发转岗超合适!

就算暂时不打算转岗,了解大模型、RAG、Prompt、Agent这些热门概念,能上手做简单项目,也绝对是求职加分王🔋

在这里插入图片描述

📝给大家整理了超全最新的AI大模型应用开发学习清单和资料,手把手帮你快速入门!👇👇

学习路线:

✅大模型基础认知—大模型核心原理、发展历程、主流模型(GPT、文心一言等)特点解析
✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑
✅开发基础能力—Python进阶、API接口调用、大模型开发框架(LangChain等)实操
✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用
✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代
✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经

以上6大模块,看似清晰好上手,实则每个部分都有扎实的核心内容需要吃透!

我把大模型的学习全流程已经整理📚好了!抓住AI时代风口,轻松解锁职业新可能,希望大家都能把握机遇,实现薪资/职业跃迁~

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

在这里插入图片描述

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐