AI时代工程师转型指南（非常详细），读懂Harness Engineering新机遇，收藏这一篇就够了！

大靠山

475人浏览 · 2026-03-26 14:40:51

大靠山 · 2026-03-26 14:40:51 发布

前言

Anthropic 在报告《Labor market impacts of AI: A new measure and early evidence （AI 对劳动力市场的影响：新度量与早期证据）》中提出了 2 个关键观点：

AI 时代最容易被冲击的职业是程序员，统计分析有 74.5% 的 AI 覆盖率。
计算机岗位理论上 AI 能做的任务是 94%，但目前实际只做到了 33%。这意味着 AI 还在蓄力，真正的冲击还没到来。

02/11/2026，OpenAI 工程师 Ryan Lopopolo 发布博文《Harness engineering: leveraging Codex in an agent-first world》提出观点：

OpenAI 花了五个月，构建一个真实上线的、拥有约 100 万行代码的复杂系统。期间大约合并了一千五百个 PR，而人类程序员没有写 1 行代码。
工程师不再写代码，而是为 Agent 搭建自动化工作的环境。

这 2 个观点说明了程序员在当下所面临的局面 —— 以前，代码是昂贵的资产。现在，代码变成了廉价的编译产物。它像打印出来的纸一样，随时可以生成，随时可以丢弃 —— 只写代码不转型，就意味着被 AI 淘汰。

从 “程序员” 到 “Harness Engineering 工程师”

自从 Vibe Coding、Spec Coding 高速发展以来，软件开发的范式已经发生了根本性转变 —— 从 “人写代码” 转向 “人设计、AI 实现、人验证”。在这个新范式中，人类的核心价值不再是敲键盘的速度，而是以下 3 大能力：

设计能力：定义目标和方案
判断能力：选择正确的方向
验证能力：识别结果的好坏

而 Harness Engineering（驾驭工程）就是指围绕 AI Agent（特别是 Coding Agent，如 CodeX、ClaudeCode）设计和构建基于 AI 编程的 “工作流控制、约束机制、反馈回路和持续改进循环” 的系统工程实践。它解决的核心问题是：当 AI Agent 拥有了强大的代码生成能力后，如何确保其输出的可靠性、一致性和长期可维护性。

Harness Engineering 标志着程序员的工作内容从 “写代码” 到 “让 AI 写代码” 再到 “设计让模型可靠工作的系统” 的范式转变。

	价值	工作模式
程序员	代码是核心资产，精确实现需求，逐行编写代码。	代码实现、Bug 修复、性能优化。
AI 应用工程师	代码只是意图的载体。真正昂贵的是你的意图（Intent）和判断力（Judgment）。	有品位的设计、正确的方向、可靠的工程验收、可行的方案落地。
Harness Engineering 工程师	驾驭 AI Coding 产出高质量、可维护的代码。	设计 AI 编写代码的环境。

新的能力维度

Redis 作者 Antirez 最近说了一句话：Programming is now automatic，vision is not yet（编程自动化了，但判断力还没有）—— AI 替代了 “机械编码”，同时也放大了 “决策与设计” 的价值。而 Harness 工程则需要更深层次的架构思考 —— 你正在设计即使没有你持续干预也能稳定运行的系统。

实际上，“知识面” 就是 “判断力”。资深工程师所拥有的 “工程知识的广度与深度” 将是他们使用 AI 辅助时最核心的资产。

你能否提出有品位的设计？

问题定义能力：AI 能解决问题，但不会定义问题。需要工程师将模糊需求转化为清晰问题的能力。
领域知识深度：AI 是通用工具，但不精通领域知识。对特定的领域有深刻理解（金融、医疗、制造等），构建 “行业 + AI 技术” 的复合型能力壁垒。
创新设计能力：创造性地解决问题的能力。有很多新的问题，其实有很多问题有多种解法。

你能否进行可靠的 AI 工程验收？

软件工程能力：掌握 Claude Code、SDD、STDD 等新型软件工程能力。把一个模糊的需求变成可执行的方案，并在 AI 的帮助下构建复杂项目。
架构设计能力：AI 能生成代码，但不会设计复杂的分布式系统。需要工程师设计组件关系、设计系统边界的能力。例如需要引入 RAG 吗？需要高速缓存吗？如何保证数据一致性？
Harness Engineering 系统思维：理解约束、反馈回路和文档如何相互作用。
质量把控能力：判断 AI 产出好坏、持续改进的能力。

你能否推进方案的落地？

项目管理能力：具有基本的 Project Manager 能力，可以让项目在规定的时间内高质量完成。
沟通与协作能力：AI 时代人人都是开发者，但做成事情还需要建立连接业务、产品、技术的桥梁。
商业思维能力：真正懂得客户需求，并使用商业销售的方式进行交付。

新的技术堆栈

AI Coding 方法论和工具：Cursor、Claude Code、SDD、TDD、BMAD 等等。
AI Agent 框架与技术：LangChain、RAG、向量数据库、MCP、Skills 等等。
Prompt / Context / Harness Engineering：能引导 AI 产出高质量、符合团队规范的代码。
大模型训练与推理：Pandas、vLLM、Triton、Weights & Biases 等等。

Harness engineering 是 AI Coding 的控制论

“Harness” 的含义

“Harness” 本意是 “马具” —— 缰绳、马鞍、马嚼子，这是一整套用于引导强大但不可预测的动物走向正确方向的装置。

比喻	含义	作用
马	AI 模型	强大、快速，但不知道自己该往哪走
Harness（马具）	基础设施	约束、护栏、反馈回路，将模型的力量转化为生产力
骑手	人类工程师	提供方向，而不是亲自奔跑

简而言之，如果没有 Harness，AI Agent 就像一匹在旷野中奔跑的野马。虽然速度惊人，但对完成任务毫无用处。

另外，Cobus Greyling 用计算机来类比解释 Harness：

计算机组件	Harness 对应	作用
CPU	大模型	原始处理能力
RAM	上下文窗口	有限的工作记忆
操作系统	Harness	管理上下文、初始化序列、标准工具驱动
应用程序	Agent	在操作系统之上运行

大模型是原始处理能力。上下文窗口是有限的工作记忆。Harness 是操作系统，它管理上下文、初始化序列和标准工具驱动。Agent 是在其上运行的应用程序。

AI 时代的控制论

在 OpenAI 报告中，Harness engineering 工程师的核心职责只剩下了 3 件事情：

设计环境：你要给 Agent 搭好脚手架，例如仓库结构、CI 流水线、Lint 静态检查规则、开发者工具等。这些是 Agent 自动化工作依赖的基础设施。
明确意图：你要用足够清晰的语言告诉 Agent 你到底想要什么，而不是模糊地说 “帮我写个功能”。工程师要把需求拆解成 Agent 能理解的、无歧义的规范，SDD 就是为此而诞生的。
构建反馈：这是最关键的一环，也是 Harness engineering 被称之为 AI 时代的 “控制论（Cybernetics）” 的原因。它的核心思想是：把 AI Agent 放进一个循环里，给它一个目标，让它反复执行（编码、审查、测试、修复），直到这个闭环跑通为止。而且，过程中人类并不需要审查这些 PR。这就是反馈闭环工程，随着成熟度的提升，可以把几乎所有的代码审查工作，都交给了 Agent 之间互相审查。

可见，在 Harness Engineering 里，工程师变成了 “反馈闭环系统” 设计师 —— 人类掌舵，Agent 执行 —— 设计环境、构建反馈回路、将架构约束编成规则，然后由 AI Agent 来写代码。它的实现依赖足够强大的传感器和执行器来进行反馈。

传统流程：

需求 → 编码 → 测试 → 调试 → 代码审查 → 合并
↑______________|
人工循环

Harness 流程：

需求 → Prompt → Agent 编码 → 自动测试 → 自动修复 → 人工审查 → 合并
↑______________|
自动循环

Harness Engineering 的三大支柱

上下文工程（Context Engineering）：
架构约束（Architectural Constraints）：采用一系列工具对软件的架构进行约束，比如 Pre-commit 钩子令代码提交前的自动检查；CI 门控令 PR 合并前必须通过所有检查；自定义 Linter 令代码符合自定义的静态检查规则。
熵管理（Entropy Management）：随着时间的推移，AI 生成的代码库会积累熵，比如代码和规范文档脱节、死代码堆积等等。为了降低熵，可以采用人工清理；也可以使用交叉验证 Agent 进行周期性扫描的方式进行自动清理。

构建一个 Harness

使用 Claude Code 作为构建一个完整的 Harness Engineering 包括：

Harness Engineering
├── CLAUDE.md
├── ARCHITECTURE.md # 架构总览
├── AGENTS.md
│   ├── 项目简介
│   ├── 架构原则
│   ├── 编码规范
│   ├── 测试策略
│   └── 常见陷阱
├── docs/ 目录
│   ├── architecture/
│   ├── design/
│   ├── plans/
│   └── quality/
├── 自定义 Linter
│   ├── 架构约束
│   └── 修复指令
├── CI/CD 流水线
│   ├── Lint 检查
│   ├── 测试执行
│   ├── 覆盖率检查
│   └── 架构验证
├── 可观测性集成
│   ├── LogQL 查询
│   ├── PromQL 查询
│   └── 分布式追踪
└── 浏览器自动化
├── DOM 快照
├── 截图
└── 端到端测试

AGENTS.md 文件

AGENTS.md 是一个位于代码库根目录的 Markdown 文件，Coding Agent 在每个会话开始时自动读取。它告诉 Coding Agent 需要知道的内容：构建步骤、测试命令、编码约定、架构约束、常见陷阱等。

OpenAI 对 AGENTS.md 最佳实践有 2 点：

渐进式披露，保持短小（约 100 行）。把 AGENTS.md 作为一个目录清单，指向更深层次的规范文件。
Agent 的每次失败都更新到 AGENTS.md，使文档成为反馈循环的落实，以求不再从滔覆辙。

# AGENTS.md
## 项目简介
[一句话描述项目目标]
## 技术栈
- 语言：
- 框架：
- 数据库：
- 部署：
## 快速开始
### 构建
[构建命令]
### 测试
[测试命令，包括覆盖率]
### 运行
[本地运行命令]
## 架构原则
### 分层架构
[简要描述分层，指向 docs/architecture/]
### 依赖方向
[允许的依赖方向，如 Types → Config → Service → UI]
### 横切关注点
[如何处理 auth、logging、telemetry]
## 编码规范
### 命名约定
[文件、变量、函数命名规则]
### 代码组织
[文件大小限制、模块划分]
### 错误处理
[错误处理模式、日志规范]
## 测试策略
### 单元测试
[框架、覆盖率要求]
### 集成测试
[范围、运行频率]
### 端到端测试
[工具、关键路径]
## 常见陷阱
### ⚠️ 不要做的事
1. [陷阱 1 及原因]
2. [陷阱 2 及原因]
3. [陷阱 3 及原因]
### ✅ 应该做的事
1. [最佳实践 1]
2. [最佳实践 2]
## 深入阅读，渐进式披露
- 架构详情：docs/architecture/overview.md
- 设计原则：docs/design/principles.md
- 技术债：docs/plans/tech-debt.md

docs/ 目录

docs/ 目录是 AGENTS.md 的深层次规范文件，包括：

docs/
├── architecture/      # 架构文档
│   ├── overview.md    # 分层架构图
│   ├── domains/       # 业务域划分
│   └── layers/        # 各层职责
│
├── design/            # 设计决策
│   ├── decisions/     # ADR（架构决策记录）
│   ├── principles/    # 核心信念
│   └── constraints/   # 约束规则
│
├── plans/             # 执行计划
│   ├── active/        # 进行中
│   ├── completed/     # 已完成
│   └── tech-debt.md   # 技术债追踪
│
├── quality/           # 质量评级
│   ├── grades.md      # 各领域质量评分
│   └── metrics.md     # 关键指标
│
├── generated/         # 自动生成
│   └── db-schema.md   # 数据库 Schema
│
├── product-specs/     # 产品规格
│   ├── index.md
│   └── features/      # 功能列表
│
└── references/        # 外部参考
├── design-system-llms.txt
└── libraries-llms.txt

动态上下文信息

OpenAI 团队将可观测性工具暴露给 Agent，以此来提供实时的上下文信息，包括：

Logs：通过 LogQL 查询
Metrics：通过 PromQL 查询
Traces：分布式追踪

AI 应用工程师的职业画像

AI 协同型技术专家

把 AI 当 “超级副驾驶”，专注系统设计、复杂逻辑与质量把控，不做纯编码。

核心能力：

熟练使用 AI Coding 工具，掌握 Prompt 工程、代码评审，具备 AI 结果验收和评估能力。
精通计算机底层原理、系统设计、数据建模、微服务/云原生架构、性能优化、安全。
能快速定位 AI 生成代码的逻辑漏洞、性能问题与业务偏差。

成长路径：

短期（1 年）：成为团队 AI 赋能者，用 AI 提效 30%–50%，主导 AI 工具落地。
中期（1–3 年）：成长为 AI 技术骨干，主导中小型 AI 项目（如企业智能系统）。
长期（3–5 年）：晋升 AI 架构师 / 技术负责人，规划 AI 技术路线、设计规模化 AI 平台。

垂直领域 AI 专家

“行业 + AI 技术” 双精通，成为 AI 在垂直场景落地的核心专家。

高价值赛道如下：

金融科技：智能风控、量化交易、智能合约、监管合规。
医疗健康：医学影像 AI、临床决策支持、医疗数据隐私（HIPAA）。
智能制造：工业互联网、IoT+AI、预测性维护、数字孪生。
自动驾驶 / 机器人：感知、决策、控制、边缘计算优化。
企业服务：低代码 / 无代码平台、RPA+AI、智能客服、数据分析。

核心能力：

扎实的 AI 工程能力：vLLM、多模态、微调、RAG、向量数据库。
深厚的行业知识：业务流程、合规、数据标准、痛点。
能将 AI 技术转化为可落地的行业解决方案。

成长路径：深耕 1 个垂直领域，3–5 年成为行业 AI 解决方案专家，薪资比通用开发高50%+。

AI 原生开发者

专注于 AI 大模型、AI Infra 基础设施、AI 训推框架的 AI 核心软件。是 AI 时代的 “核心基建者”。岗位方向有 LLM 应用开发工程师、AI Agent 工程师、多模态开发工程师、AI 训练工程师。

核心能力：

精通大模型技术栈：Transformer、LLaMA、Qwen、微调、RAG、Agent、多模态。
掌握 AI 工程化：模型部署（vLLM、SGLang）、分布式训练、AI Agent 系统。
熟悉 AI 安全、hallucination 治理、可解释性（XAI）。

成长路径：从 AI 应用开发 → 模型调优与工程化 → AI 架构师 / 技术负责人。

技术管理/产品复合型人才

从纯技术走向 “AI 技术 + 管理 / 产品”，成为连接技术和业务部门之间的核心角色。

方向 1：AI 技术管理（CTO / 技术总监 / 研发经理）的核心能力：

技术战略
团队管理
项目管理
AI 技术选型与落地
商业价值转化

方向 2：技术型产品经理（TPM）的核心能力：

需求分析
产品设计
AI 技术可行性评估
跨部门协作
数据驱动决策

AI 时代的成长者 or 退化者？

周鸿祎在接受采访时提出：35 岁程序员会更吃香。因为对于资深专家（Senior）来说，AI 能让他们以一当十。但对于初级员工（Junior）来说，AI 是其完美的替代品。以前资深程序员手把手教，一年能带出 2-3 个中级程序员。但现在资深程序员会将自己的经验沉淀为 AI 系统，他人直接使用即可。生态中只剩下 “用 AI 造轮子的人” 和 “用轮子的人”。

但仍值得注意的是 Anthropic 的另一篇报告《How AI assistance impacts the formation of coding skills》中提出了一个严肃的观点：AI 编程使得程序员正用短期效率，抵押长期能力。即：对于技术初学者而言，AI 生成代码往往很省事，但实际上也剥夺了最关键的 “从失败中建构知识” 的机会。如何与 AI 协作而不被吞噬？这是很多工程师都需要思考的问题。

对此，Anthropic 的建议是：

对于工程师而言：多做 “提问者”，而非 “索要者”。多问 “为什么这样设计？”，多思考 “还有没有其他解法，不同解法之间的区别是怎样的？各自的应用场景是什么？”，并且通过实践来进行验证，以此来加深底层技术原理的理解和培养自己的决策力。
对于企业管理者而言：禁止在核心生产系统中完全依赖 AI 编程。将 “无 AI 编程能力” 纳入工程师评估体系，防止团队性的技能退化。教会员工如何有策略地使用 AI，而非盲目依赖。

学AI大模型的正确顺序，千万不要搞错了

🤔2026年AI风口已来！各行各业的AI渗透肉眼可见，超多公司要么转型做AI相关产品，要么高薪挖AI技术人才，机遇直接摆在眼前！

有往AI方向发展，或者本身有后端编程基础的朋友，直接冲AI大模型应用开发转岗超合适！

就算暂时不打算转岗，了解大模型、RAG、Prompt、Agent这些热门概念，能上手做简单项目，也绝对是求职加分王🔋

在这里插入图片描述

📝给大家整理了超全最新的AI大模型应用开发学习清单和资料，手把手帮你快速入门！👇👇

学习路线:

✅大模型基础认知—大模型核心原理、发展历程、主流模型（GPT、文心一言等）特点解析
✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑
✅开发基础能力—Python进阶、API接口调用、大模型开发框架（LangChain等）实操
✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用
✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代
✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经

以上6大模块，看似清晰好上手，实则每个部分都有扎实的核心内容需要吃透！

我把大模型的学习全流程已经整理📚好了！抓住AI时代风口，轻松解锁职业新可能，希望大家都能把握机遇，实现薪资/职业跃迁～

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【`保证100%免费`】

在这里插入图片描述

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

陈刚直言｜到底什么是工业场景？

AtomGit开源社区

国内首个 Frontier 三件套开源大模型：MiniMax M3 完整技术拆解

刚刚，MiniMax M3 正式官宣发布。根据官方介绍，MiniMax M3 是国内首个同时具备三个核心能力的开源模型，同时还推出了配套代码智能体产品 MiniMax Code。不过，开发者体验下来，M3 的体感全面超过Sonnet 4.6，但官方坦诚表示，其与 Opus 4.7、GPT-5.5 仍存在一定差距。具体来说，在 SWE-Bench Pro 上超过了 GPT-5.5 和 Gemini