Claude Code Harness Engineering介绍（Agent = Model + Harness 模型提供智力，Harness（马具/控制系统）提供控制、可靠性和生产力）多代理协作

Dontla

357人浏览 · 2026-05-05 16:23:51

Dontla · 2026-05-05 16:23:51 发布

Code Harness：AI Agent 的超级引擎——Claude Code 背后的秘密

引言：为什么“Harness”才是真正的决胜点？

2025-2026 年，AI 编码工具爆发式增长：Claude Code、Cursor、Aider、Cline 等层出不穷。很多人以为胜负取决于底层模型（谁的 LLM 更聪明），但真正的高手和 Anthropic 内部却达成了共识：

Agent = Model + Harness
模型提供智力，Harness（马具/控制系统） 提供控制、可靠性和生产力。

Code Harness（代码马具 / Agent Harness）就是围绕大模型构建的完整工程基础设施。它把一个“会聊天的 LLM”变成能长期自主编码、读写文件、运行测试、跨会话保持一致性的真正 Agent。

Claude Code 的成功，不是因为 Claude 模型突然变得无比强大，而是因为 Boris Cherny 及其团队打造了一套顶级的 Code Harness。

Code Harness 到底是什么？

Harness 是模型与真实世界之间的“中间层”：

不是单纯的 Prompt Engineering
不是简单的 Tool Calling
而是一整套生产级系统，包括：工具调度、权限控制、上下文管理、状态持久化、错误恢复、多 Agent 协作、监控循环等。

简单说，它是让 Agent “靠谱地活下去”的操作系统。

Anthropic 官方工程博客多次强调：Harness design 是 agentic coding 前沿性能的关键。

Claude Code Harness 的核心架构

根据公开的 Anthropic 工程文章、源码泄露分析（2026 年事件）和 Boris Cherny 的分享，Claude Code Harness 主要包含以下部分：

Master Loop（主循环）
单线程或协调式循环，不断驱动：感知（读上下文）→ 推理 → Tool Call → 执行结果反馈 → 下一轮。直到任务完成或需要人工介入。
Tool System（工具层，约 40 个权限门控工具）
- 文件读写、bash 执行、grep、glob、浏览器、LSP（语言服务器）集成等。
- 严格权限控制：默认谨慎模式，每项危险操作需用户批准；内置分类器自动判断安全动作。
- Typed schemas 约束模型输出，确保 harness 能可靠解析和执行。
Context & Memory Management（上下文与记忆）
- 多层记忆架构：对抗“context entropy”（上下文混乱）。
- 支持长运行（long-running）跨多个 context window。
- Initializer Agent：首次会话负责项目初始化、任务分解、环境搭建、留下清晰 artifacts。
- Coding Sub-Agents：后续会话专注增量实现，自动 compaction（上下文压缩）。
- CLAUDE.md、Skills（.claude/skills/ 目录下的 Markdown 技能包）提供持久项目规则。
Multi-Agent Orchestration（多代理协作）
Planner / Generator / Evaluator 三代理结构（受 GAN 启发），或 Initiator + Sub-agents 模式。支持并行舰队（fleet of Claudes）。
Safety & Recovery
沙箱执行、失败重试、会话日志完整记录（每条消息、tool call 都可追溯）。人类始终保留最终决策权。
Claude Agent SDK
Anthropic 提供的通用 harness 基础，Claude Code 在此之上高度定制。

诞生故事：Boris Cherny 的“意外”

Boris Cherny（前 Meta Principal Engineer，《Programming TypeScript》作者）2024 年加入 Anthropic 后，用 Claude 做各种原型。最初只是个简单命令行工具（甚至能识别你在听什么歌），后来逐步获得文件系统权限，在公司内部爆火，最终演变为正式产品。

他强调：早期 Claude Code 并不惊艳，直到模型（Sonnet/Opus 4 系列）足够强大 + harness 迭代成熟，才实现爆发。现在 Anthropic 大部分代码都由 Claude Code 编写，工程师生产力大幅提升。

为什么 Harness 这么重要？实际影响

相同模型，不同 Harness，性能天差地别。Terminal Bench 等评测显示，换个好 harness 能让同一模型排名大幅上升。
解决 Long-Running Agent 难题：跨会话、跨 context window 保持一致性。
可复制性：2026 年源码泄露后，社区涌现大量“从零构建 Claude Code 式 harness”的教程和开源项目。
未来方向：Harness Engineering 已成为新学科。Prompt → Context → Harness 是进化路径。

如何开始构建或使用自己的 Code Harness？

直接用 Claude Code（最推荐）。
参考 Anthropic 官方：
- Effective harnesses for long-running agents
- Harness design for long-running application development
开源/社区：研究 Claude Agent SDK quickstarts、GitHub trending 的 best practices repos。
核心原则（Boris 分享）：
- 信任模型，但用严格工具和权限约束它。
- 做好初始化和 artifacts 交接。
- 人类负责方向，Agent 负责执行。
- 迭代 harness，比单纯优化 prompt 更重要。