前言

Anthropic 在报告《Labor market impacts of AI: A new measure and early evidence (AI 对劳动力市场的影响:新度量与早期证据)》中提出了 2 个关键观点:

  1. AI 时代最容易被冲击的职业是程序员,统计分析有 74.5% 的 AI 覆盖率。
  2. 计算机岗位理论上 AI 能做的任务是 94%,但目前实际只做到了 33%。这意味着 AI 还在蓄力,真正的冲击还没到来。

02/11/2026,OpenAI 工程师 Ryan Lopopolo 发布博文《Harness engineering: leveraging Codex in an agent-first world》提出观点:

  1. OpenAI 花了五个月,构建一个真实上线的、拥有约 100 万行代码的复杂系统。期间大约合并了一千五百个 PR,而人类程序员没有写 1 行代码。
  2. 工程师不再写代码,而是为 Agent 搭建自动化工作的环境。

这 2 个观点说明了程序员在当下所面临的局面 —— 以前,代码是昂贵的资产。现在,代码变成了廉价的编译产物。它像打印出来的纸一样,随时可以生成,随时可以丢弃 —— 只写代码不转型,就意味着被 AI 淘汰。

从 “程序员” 到 “Harness Engineering 工程师”

自从 Vibe Coding、Spec Coding 高速发展以来,软件开发的范式已经发生了根本性转变 —— 从 “人写代码” 转向 “人设计、AI 实现、人验证”。在这个新范式中,人类的核心价值不再是敲键盘的速度,而是以下 3 大能力:

  1. 设计能力:定义目标和方案
  2. 判断能力:选择正确的方向
  3. 验证能力:识别结果的好坏

而 Harness Engineering(驾驭工程)就是指围绕 AI Agent(特别是 Coding Agent,如 CodeX、ClaudeCode)设计和构建基于 AI 编程的 “工作流控制、约束机制、反馈回路和持续改进循环” 的系统工程实践。它解决的核心问题是:当 AI Agent 拥有了强大的代码生成能力后,如何确保其输出的可靠性、一致性和长期可维护性。

Harness Engineering 标志着程序员的工作内容从 “写代码” 到 “让 AI 写代码” 再到 “设计让模型可靠工作的系统” 的范式转变。

价值 工作模式
程序员 代码是核心资产,精确实现需求,逐行编写代码。 代码实现、Bug 修复、性能优化。
AI 应用工程师 代码只是意图的载体。真正昂贵的是你的意图(Intent)和判断力(Judgment)。 有品位的设计、正确的方向、可靠的工程验收、可行的方案落地。
Harness Engineering 工程师 驾驭 AI Coding 产出高质量、可维护的代码。 设计 AI 编写代码的环境。

新的能力维度

Redis 作者 Antirez 最近说了一句话:Programming is now automatic,vision is not yet(编程自动化了,但判断力还没有)—— AI 替代了 “机械编码”,同时也放大了 “决策与设计” 的价值。而 Harness 工程则需要更深层次的架构思考 —— 你正在设计即使没有你持续干预也能稳定运行的系统。

实际上,“知识面” 就是 “判断力”。资深工程师所拥有的 “工程知识的广度与深度” 将是他们使用 AI 辅助时最核心的资产。

你能否提出有品位的设计?

  • 问题定义能力:AI 能解决问题,但不会定义问题。需要工程师将模糊需求转化为清晰问题的能力。
  • 领域知识深度:AI 是通用工具,但不精通领域知识。对特定的领域有深刻理解(金融、医疗、制造等),构建 “行业 + AI 技术” 的复合型能力壁垒。
  • 创新设计能力:创造性地解决问题的能力。有很多新的问题,其实有很多问题有多种解法。

你能否进行可靠的 AI 工程验收?

  • 软件工程能力:掌握 Claude Code、SDD、STDD 等新型软件工程能力。把一个模糊的需求变成可执行的方案,并在 AI 的帮助下构建复杂项目。
  • 架构设计能力:AI 能生成代码,但不会设计复杂的分布式系统。需要工程师设计组件关系、设计系统边界的能力。例如需要引入 RAG 吗?需要高速缓存吗?如何保证数据一致性?
  • Harness Engineering 系统思维:理解约束、反馈回路和文档如何相互作用。
  • 质量把控能力:判断 AI 产出好坏、持续改进的能力。

你能否推进方案的落地?

  • 项目管理能力:具有基本的 Project Manager 能力,可以让项目在规定的时间内高质量完成。
  • 沟通与协作能力:AI 时代人人都是开发者,但做成事情还需要建立连接业务、产品、技术的桥梁。
  • 商业思维能力:真正懂得客户需求,并使用商业销售的方式进行交付。

新的技术堆栈

  1. AI Coding 方法论和工具:Cursor、Claude Code、SDD、TDD、BMAD 等等。
  2. AI Agent 框架与技术:LangChain、RAG、向量数据库、MCP、Skills 等等。
  3. Prompt / Context / Harness Engineering:能引导 AI 产出高质量、符合团队规范的代码。
  4. 大模型训练与推理:Pandas、vLLM、Triton、Weights & Biases 等等。

Harness engineering 是 AI Coding 的控制论

“Harness” 的含义

“Harness” 本意是 “马具” —— 缰绳、马鞍、马嚼子,这是一整套用于引导强大但不可预测的动物走向正确方向的装置。

比喻 含义 作用
AI 模型 强大、快速,但不知道自己该往哪走
Harness(马具) 基础设施 约束、护栏、反馈回路,将模型的力量转化为生产力
骑手 人类工程师 提供方向,而不是亲自奔跑

简而言之,如果没有 Harness,AI Agent 就像一匹在旷野中奔跑的野马。虽然速度惊人,但对完成任务毫无用处。

另外,Cobus Greyling 用计算机来类比解释 Harness:

计算机组件 Harness 对应 作用
CPU 大模型 原始处理能力
RAM 上下文窗口 有限的工作记忆
操作系统 Harness 管理上下文、初始化序列、标准工具驱动
应用程序 Agent 在操作系统之上运行

大模型是原始处理能力。上下文窗口是有限的工作记忆。Harness 是操作系统,它管理上下文、初始化序列和标准工具驱动。Agent 是在其上运行的应用程序。

AI 时代的控制论

在 OpenAI 报告中,Harness engineering 工程师的核心职责只剩下了 3 件事情:

  1. 设计环境:你要给 Agent 搭好脚手架,例如仓库结构、CI 流水线、Lint 静态检查规则、开发者工具等。这些是 Agent 自动化工作依赖的基础设施。
  2. 明确意图:你要用足够清晰的语言告诉 Agent 你到底想要什么,而不是模糊地说 “帮我写个功能”。工程师要把需求拆解成 Agent 能理解的、无歧义的规范,SDD 就是为此而诞生的。
  3. 构建反馈:这是最关键的一环,也是 Harness engineering 被称之为 AI 时代的 “控制论(Cybernetics)” 的原因。它的核心思想是:把 AI Agent 放进一个循环里,给它一个目标,让它反复执行(编码、审查、测试、修复),直到这个闭环跑通为止。而且,过程中人类并不需要审查这些 PR。这就是反馈闭环工程,随着成熟度的提升,可以把几乎所有的代码审查工作,都交给了 Agent 之间互相审查。

可见,在 Harness Engineering 里,工程师变成了 “反馈闭环系统” 设计师 —— 人类掌舵,Agent 执行 —— 设计环境、构建反馈回路、将架构约束编成规则,然后由 AI Agent 来写代码。它的实现依赖足够强大的传感器和执行器来进行反馈。

传统流程:

需求 → 编码 → 测试 → 调试 → 代码审查 → 合并
↑______________|
人工循环

Harness 流程:

需求 → Prompt → Agent 编码 → 自动测试 → 自动修复 → 人工审查 → 合并
↑______________|
自动循环

Harness Engineering 的三大支柱

  1. 上下文工程(Context Engineering)
  2. 架构约束(Architectural Constraints):采用一系列工具对软件的架构进行约束,比如 Pre-commit 钩子令代码提交前的自动检查;CI 门控令 PR 合并前必须通过所有检查;自定义 Linter 令代码符合自定义的静态检查规则。
  3. 熵管理(Entropy Management):随着时间的推移,AI 生成的代码库会积累熵,比如代码和规范文档脱节、死代码堆积等等。为了降低熵,可以采用人工清理;也可以使用交叉验证 Agent 进行周期性扫描的方式进行自动清理。

构建一个 Harness

使用 Claude Code 作为构建一个完整的 Harness Engineering 包括:

Harness Engineering
├── CLAUDE.md
├── ARCHITECTURE.md # 架构总览
├── AGENTS.md
│   ├── 项目简介
│   ├── 架构原则
│   ├── 编码规范
│   ├── 测试策略
│   └── 常见陷阱
├── docs/ 目录
│   ├── architecture/
│   ├── design/
│   ├── plans/
│   └── quality/
├── 自定义 Linter
│   ├── 架构约束
│   └── 修复指令
├── CI/CD 流水线
│   ├── Lint 检查
│   ├── 测试执行
│   ├── 覆盖率检查
│   └── 架构验证
├── 可观测性集成
│   ├── LogQL 查询
│   ├── PromQL 查询
│   └── 分布式追踪
└── 浏览器自动化
├── DOM 快照
├── 截图
└── 端到端测试

AGENTS.md 文件

AGENTS.md 是一个位于代码库根目录的 Markdown 文件,Coding Agent 在每个会话开始时自动读取。它告诉 Coding Agent 需要知道的内容:构建步骤、测试命令、编码约定、架构约束、常见陷阱等。

OpenAI 对 AGENTS.md 最佳实践有 2 点:

  1. 渐进式披露,保持短小(约 100 行)。把 AGENTS.md 作为一个目录清单,指向更深层次的规范文件。
  2. Agent 的每次失败都更新到 AGENTS.md,使文档成为反馈循环的落实,以求不再从滔覆辙。
# AGENTS.md
## 项目简介
[一句话描述项目目标]
## 技术栈
- 语言:
- 框架:
- 数据库:
- 部署:
## 快速开始
### 构建
[构建命令]
### 测试
[测试命令,包括覆盖率]
### 运行
[本地运行命令]
## 架构原则
### 分层架构
[简要描述分层,指向 docs/architecture/]
### 依赖方向
[允许的依赖方向,如 Types → Config → Service → UI]
### 横切关注点
[如何处理 auth、logging、telemetry]
## 编码规范
### 命名约定
[文件、变量、函数命名规则]
### 代码组织
[文件大小限制、模块划分]
### 错误处理
[错误处理模式、日志规范]
## 测试策略
### 单元测试
[框架、覆盖率要求]
### 集成测试
[范围、运行频率]
### 端到端测试
[工具、关键路径]
## 常见陷阱
### ⚠️ 不要做的事
1. [陷阱 1 及原因]
2. [陷阱 2 及原因]
3. [陷阱 3 及原因]
### ✅ 应该做的事
1. [最佳实践 1]
2. [最佳实践 2]
## 深入阅读,渐进式披露
- 架构详情:docs/architecture/overview.md
- 设计原则:docs/design/principles.md
- 技术债:docs/plans/tech-debt.md

docs/ 目录

docs/ 目录是 AGENTS.md 的深层次规范文件,包括:

docs/
├── architecture/      # 架构文档
│   ├── overview.md    # 分层架构图
│   ├── domains/       # 业务域划分
│   └── layers/        # 各层职责
│
├── design/            # 设计决策
│   ├── decisions/     # ADR(架构决策记录)
│   ├── principles/    # 核心信念
│   └── constraints/   # 约束规则
│
├── plans/             # 执行计划
│   ├── active/        # 进行中
│   ├── completed/     # 已完成
│   └── tech-debt.md   # 技术债追踪
│
├── quality/           # 质量评级
│   ├── grades.md      # 各领域质量评分
│   └── metrics.md     # 关键指标
│
├── generated/         # 自动生成
│   └── db-schema.md   # 数据库 Schema
│
├── product-specs/     # 产品规格
│   ├── index.md
│   └── features/      # 功能列表
│
└── references/        # 外部参考
├── design-system-llms.txt
└── libraries-llms.txt

动态上下文信息

OpenAI 团队将可观测性工具暴露给 Agent,以此来提供实时的上下文信息,包括:

  • Logs:通过 LogQL 查询
  • Metrics:通过 PromQL 查询
  • Traces:分布式追踪

AI 应用工程师的职业画像

AI 协同型技术专家

把 AI 当 “超级副驾驶”,专注系统设计、复杂逻辑与质量把控,不做纯编码。

核心能力:

  • 熟练使用 AI Coding 工具,掌握 Prompt 工程、代码评审,具备 AI 结果验收和评估能力。
  • 精通计算机底层原理、系统设计、数据建模、微服务/云原生架构、性能优化、安全。
  • 能快速定位 AI 生成代码的逻辑漏洞、性能问题与业务偏差。

成长路径:

  • 短期(1 年):成为团队 AI 赋能者,用 AI 提效 30%–50%,主导 AI 工具落地。
  • 中期(1–3 年):成长为 AI 技术骨干,主导中小型 AI 项目(如企业智能系统)。
  • 长期(3–5 年):晋升 AI 架构师 / 技术负责人,规划 AI 技术路线、设计规模化 AI 平台。

垂直领域 AI 专家

“行业 + AI 技术” 双精通,成为 AI 在垂直场景落地的核心专家。

高价值赛道如下:

  • 金融科技:智能风控、量化交易、智能合约、监管合规。
  • 医疗健康:医学影像 AI、临床决策支持、医疗数据隐私(HIPAA)。
  • 智能制造:工业互联网、IoT+AI、预测性维护、数字孪生。
  • 自动驾驶 / 机器人:感知、决策、控制、边缘计算优化。
  • 企业服务:低代码 / 无代码平台、RPA+AI、智能客服、数据分析。

核心能力:

  • 扎实的 AI 工程能力:vLLM、多模态、微调、RAG、向量数据库。
  • 深厚的行业知识:业务流程、合规、数据标准、痛点。
  • 能将 AI 技术转化为可落地的行业解决方案。

成长路径:深耕 1 个垂直领域,3–5 年成为行业 AI 解决方案专家,薪资比通用开发高50%+。

AI 原生开发者

专注于 AI 大模型、AI Infra 基础设施、AI 训推框架的 AI 核心软件。是 AI 时代的 “核心基建者”。岗位方向有 LLM 应用开发工程师、AI Agent 工程师、多模态开发工程师、AI 训练工程师。

核心能力:

  • 精通大模型技术栈:Transformer、LLaMA、Qwen、微调、RAG、Agent、多模态。
  • 掌握 AI 工程化:模型部署(vLLM、SGLang)、分布式训练、AI Agent 系统。
  • 熟悉 AI 安全、hallucination 治理、可解释性(XAI)。

成长路径:从 AI 应用开发 → 模型调优与工程化 → AI 架构师 / 技术负责人。

技术管理/产品复合型人才

从纯技术走向 “AI 技术 + 管理 / 产品”,成为连接技术和业务部门之间的核心角色。

方向 1:AI 技术管理(CTO / 技术总监 / 研发经理)的核心能力:

  • 技术战略
  • 团队管理
  • 项目管理
  • AI 技术选型与落地
  • 商业价值转化

方向 2:技术型产品经理(TPM)的核心能力:

  • 需求分析
  • 产品设计
  • AI 技术可行性评估
  • 跨部门协作
  • 数据驱动决策

AI 时代的成长者 or 退化者?

周鸿祎在接受采访时提出:35 岁程序员会更吃香。因为对于资深专家(Senior)来说,AI 能让他们以一当十。但对于初级员工(Junior)来说,AI 是其完美的替代品。以前资深程序员手把手教,一年能带出 2-3 个中级程序员。但现在资深程序员会将自己的经验沉淀为 AI 系统, 他人直接使用即可。生态中只剩下 “用 AI 造轮子的人” 和 “用轮子的人”。

但仍值得注意的是 Anthropic 的另一篇报告《How AI assistance impacts the formation of coding skills》中提出了一个严肃的观点:AI 编程使得程序员正用短期效率,抵押长期能力。即:对于技术初学者而言,AI 生成代码往往很省事,但实际上也剥夺了最关键的 “从失败中建构知识” 的机会。如何与 AI 协作而不被吞噬?这是很多工程师都需要思考的问题。

对此,Anthropic 的建议是:

  • 对于工程师而言:多做 “提问者”,而非 “索要者”。多问 “为什么这样设计?”,多思考 “还有没有其他解法,不同解法之间的区别是怎样的?各自的应用场景是什么?”,并且通过实践来进行验证,以此来加深底层技术原理的理解和培养自己的决策力。
  • 对于企业管理者而言:禁止在核心生产系统中完全依赖 AI 编程。将 “无 AI 编程能力” 纳入工程师评估体系,防止团队性的技能退化。教会员工如何有策略地使用 AI,而非盲目依赖。

学AI大模型的正确顺序,千万不要搞错了

🤔2026年AI风口已来!各行各业的AI渗透肉眼可见,超多公司要么转型做AI相关产品,要么高薪挖AI技术人才,机遇直接摆在眼前!

有往AI方向发展,或者本身有后端编程基础的朋友,直接冲AI大模型应用开发转岗超合适!

就算暂时不打算转岗,了解大模型、RAG、Prompt、Agent这些热门概念,能上手做简单项目,也绝对是求职加分王🔋

在这里插入图片描述

📝给大家整理了超全最新的AI大模型应用开发学习清单和资料,手把手帮你快速入门!👇👇

学习路线:

✅大模型基础认知—大模型核心原理、发展历程、主流模型(GPT、文心一言等)特点解析
✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑
✅开发基础能力—Python进阶、API接口调用、大模型开发框架(LangChain等)实操
✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用
✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代
✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经

以上6大模块,看似清晰好上手,实则每个部分都有扎实的核心内容需要吃透!

我把大模型的学习全流程已经整理📚好了!抓住AI时代风口,轻松解锁职业新可能,希望大家都能把握机遇,实现薪资/职业跃迁~

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

在这里插入图片描述

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐