Anthropic 在全力押注 Agent!

其工程博客是其技术团队对外输出工程实践和方法论的主要渠道。

从 2024 年 9 月到 2026 年 3 月, Agent 架构占了发表的所有文章的近四成,是最大头。

从最早的怎么设计 Agent,到后来怎么给它好工具、怎么让它跑长任务不翻车,一直到今年初 16 个 Claude 并行写出一个 C 编译器。

图片

路线

如何设计Agent —— 如何给Agent好工具 —— 如何让Agent长时间自主工作 —— Agent能做多大的事

归纳起来,其底层约束是上下文工程。

怎么在有限的 token 里塞进最多有用的信息,从 RAG 优化一路演进到了系统性的方法论。

图片

逐篇摘要

1. Building Effective Agents (2024-12-19)

基于与数十个团队合作经验的 Agent 设计原则总结。

区分 workflow(预定义路径)与 Agent(动态自主决策)。

提出六种架构模式:增强型 LLM、提示链、路由、并行化、编排者-工作者、评估者-优化者。

核心主张:最成功的实现采用简单可组合模式而非复杂框架。

2. Claude Code: Best Practices for Agentic Coding (2025-04-18)

系统性使用指南。

核心约束:上下文窗口是最重要的有限资源。

关键实践:让 Claude 自我验证(提供测试用例是效果提升最大的策略)、先探索再规划再编码、配置好 CLAUDE.md、积极管理会话(/clear 重置、/rewind 回退)。

3. How We Built Our Multi-Agent Research System (2025-06-13)

Claude Research 工程实践。

协调者-执行者架构,主智能体并行派发子智能体搜索。

多智能体比单一 Opus 4 提升 90.2%,但 token 消耗高达 15 倍。

总结八条提示词策略和以结果为导向的评估方法。

4. Writing Effective Tools for Agents (2025-09-11)

Agent 能力上限取决于工具质量。

五大设计原则:选择正确的工具、命名空间化、返回有意义的上下文、优化 Token 效率(分页/过滤/截断)、提示工程化工具描述。

强调评测驱动的迭代方法。

5. Code Execution with MCP (2025-11-04)

将 MCP 服务器封装为代码 API 而非直接工具调用。

Agent 通过文件系统按需加载工具定义,Token 消耗从 15 万降至 2000(减少 98.7%)。

核心优势:渐进式发现、数据过滤、控制流效率、状态持久化。

6. Effective Harnesses for Long-Running Agents (2025-11-26)

解决长时运行 Agent 跨会话连贯性问题。

两大失败模式:一次性塞满上下文导致不完整,或后续会话误判为已完成。

方案采用两阶段架构:初始化 Agent 创建环境和 JSON 功能列表,后续 Agent 按固定流程逐功能推进并通过 git 提交实现状态持久化。

7. Building a C Compiler with Parallel Claudes (2026-02-05)

16 个并行 Claude Opus 4.6 实例通过 Git 同步协作,两周内构建基于 Rust 的 C 编译器。

产出 10 万行代码,能编译 Linux 6.9 内核,GCC torture 通过率 99%。

消耗 20 亿输入 token,成本约 2 万美元。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐