前言:我是怎么从"偶尔用用"变成"不能离"的

说实话,我第一次听说 Claude Code 的时候,内心OS是:"又一个套壳 AI 编程助手,用两天就扔了。"

然后我一用就是将近两年。

作为一个每天要在金融系统和业务代码之间反复横跳的人,我的需求其实很矛盾: 一方面希望 AI 能记住我们公司那套奇葩的命名规范和风控逻辑; 另一方面又不想每次启动一个 session 都花五分钟贴背景信息。

直到我发现了 Skills,一切都不一样了。

但先别急,我们从头说起。这篇文章基于 2026 年 5 月最新的版本(v2.1.128+),把我用了这么久摸索出来的进阶玩法,整理成一份尽量不废话的实战指南。

考虑到国内用户订阅claude很容易风控,可以参考这个订阅网站:claudemax.shop

一、Claude Code 2026 到底更新了啥(整体架构速览)

2026 年的 Claude Code 已经不是那个"终端里跑的 GPT"了。

Anthropic 在 5 月 6 日的 Code w/ Claude 2026 开发者大会上宣布,其 API 调用量相比去年同期增长了 17 倍。这个数字很说明问题——不是因为营销做得好,是因为它真的能用。

当前的架构分四层:

第一层(用户交互):终端 CLI、VSCode/JetBrains 插件、Remote Control 远程会话,还有新出的 claude ultrareview 命令,可以直接在 CI 里非交互式运行安全审计,结果打到 stdout,完美适配流水线。

第二层(运行时与编排):这是今年变化最大的一层。Managed Agents 加入了三个重磅功能:

  • 多智能体编排(Multi-Agent Orchestration):Lead Agent 拆解任务,分配给最多 20 个并行的专家 Specialist Agent
  • Dreaming(研究预览):会话结束后,系统定时扫描历史,自动提炼、精炼 Memory
  • Outcomes:你定义"成功长什么样",一个独立的评分器在独立上下文里评判结果

第三层(能力模块):Skills、MCP 服务器、Hooks、Plugins,各司其职,下文重点展开 Skills。

第四层(模型核心):Claude Sonnet 4.6 / Opus 4.6,Opus 4.6 作为 advisor 模型在多智能体场景下配合 Sonnet 使用,SWE-bench Multilingual 测试中显著优于 Sonnet 单独跑的结果。


二、Skills 深度详解:会用 Skills,少打 80% 的废话

Skills 到底是什么

一句话:Skills 是一个文件夹,里面放一个 SKILL.md,Claude 在需要的时候自动把它装进上下文。

不是插件,不是配置面板,就是个 Markdown 文件。

~/.claude/skills/
  commit-format/
    SKILL.md          ← 这就是 skill 的全部
  risk-review/
    SKILL.md
    risk-template.md  ← 可选的辅助文件

文件结构固定到令人发笑:

---
name: commit-format
description: 按照公司规范格式化 commit message。在用户说"commit"、"提交"、"写提交信息"时触发。
---

每次生成 commit message,必须遵守以下格式:
1. 主题行 ≤ 72 字,以 [模块名] 开头,动词开头,现在时
2. Body 解释"为什么"而不是"做了什么"
3. Footer 标注关联的需求单号

禁止:使用 "fix bug"、"update code" 这类无意义描述。

就这样。没了。

Claude 启动时读取所有 skill 的 description,你发送消息时,它根据语义匹配,决定要不要把那个 SKILL.md 全文加进上下文。整个过程你看不见,但结果你能感受到——它突然"记住"了你公司的规矩。

Skills 最新特性(v2.1.128,2026-05-08)

1. /skills 搜索框过滤

如果你像我一样积累了几十个 skill,以前找起来要疯。现在 /skills 弹出来直接可以打字过滤,找到就加载,省事很多。

2. ${CLAUDE_EFFORT} 变量

在 skill 内容里可以引用当前 effort 级别,高 effort 模式可以让 skill 触发更细致的检查,低 effort 就快速过。对于我这种跑着代码又要赶 DDL 的人,非常实用。

---
name: code-review
description: 代码审查,覆盖逻辑、性能、风险三个维度。用户说"review"时触发。
---

审查深度:${CLAUDE_EFFORT}

{% if CLAUDE_EFFORT == "high" %}
- 逐行分析,检查所有边界条件
- 生成完整测试用例建议
- 分析性能热点
{% else %}
- 重点检查逻辑错误和明显风险
- 快速给出改进建议
{% endif %}

3. disableSkillShellExecution 安全设置

生产环境下,你可能不希望 skill 里的 shell 命令自动执行。在 .claude/config.json 里加一行就能关掉,企业合规场景下这个很重要。

一个真实的金融场景 Skill 案例

我们公司风控系统有一套固定的代码审查清单,每次改动核心模块都要过:

---
name: fintech-risk-check
description: 金融风控代码审查。当用户修改涉及资金计算、交易逻辑、风险模型的代码时触发。
---

## 风控代码强制检查项

### 资金计算
- [ ] 所有金额使用 Decimal 而非 float,精度不低于 8 位
- [ ] 没有隐式类型转换影响精度
- [ ] 边界值(0、负数、最大值)有明确处理

### 事务安全
- [ ] 数据库操作有明确的事务边界
- [ ] 异常时有回滚逻辑
- [ ] 不存在部分提交的可能

### 审计日志
- [ ] 所有状态变更写入 audit_log 表
- [ ] 日志包含 user_id、timestamp、before/after 值

不满足以上任意一项,审查不通过,必须明确指出并给出修改建议。

这个 skill 存好之后,我改资金相关模块,Claude 自动带着这份清单来 review,一次都没漏过。这省了我多少口水?不说了,说多了都是泪。


三、Multi-Agent 编排:让 Agent 们去打工,你来喝茶

核心概念

今年 Managed Agents 公测了多智能体编排,基本逻辑是:

  1. 你定义 Outcomes:写一个 rubric,描述"完成长什么样"
  2. Lead Agent 拆解任务:把大任务分解,分配给 Specialist Agent
  3. Specialist Agent 并行执行:各自在独立上下文窗口工作
  4. 新特性:Agent Teams 里的 Teammate 可以互相通信,不再只能向 Lead 汇报
  5. Claude Console 全链路追踪:每个 agent 做了什么、为什么、结果是什么,一目了然

Agent Teams 怎么开启

# 确保版本 >= v2.1.32
claude --version

# 目前实验性,需要在 .claude/config.json 启用
{
  "experimental": {
    "agentTeams": true
  }
}

然后告诉 Claude:

帮我并行处理以下三个任务:
1. 审查 payment_service.py 的风险点
2. 给 trade_engine.py 写单元测试
3. 更新 README 文档

用三个 agent 分别负责,完成后汇总结果。

注意:别忘了配置 worktree。多个 agent 同时改代码,不做 git worktree 隔离会打架。

Dreaming 是什么感觉

Dreaming 目前是研究预览,得单独申请。但概念很优雅:

你不用手动总结经验,它自己总结。

每隔一段时间,系统扫描你的历史会话,找出"这个 agent 老犯什么错"、"用户更喜欢哪种格式的回答"、"这个工作流大家都这么干",然后把这些发现压缩进 Memory,下次直接生效。

你可以选自动更新,或者先人工 review 再落地。对于金融场景,我个人倾向于先 review——毕竟让 AI 自己决定改什么规则,万一改坏了可不是小事。


四、进阶玩法速查:那些藏在更新日志里的宝藏

这一节送给跟我一样爱翻 changelog 的人。

/powerup:互动式新手训练营

claude /powerup

会弹出一系列动画演示,教你 Claude Code 的核心功能。不是文档,是可以操作的 demo。对新同事 onboarding 超好用,比让他们自己看文档强多了。

claude ultrareview:CI 里跑安全审计

# 在 CI 管道里调用
claude ultrareview ./src --json > review_result.json

退出码 0 = 审计通过,1 = 发现问题,配合 GitHub Actions 就能做到每次 PR 自动触发安全 review,我们团队已经接进去了。

Hooks 的新玩法:PostToolUse 全局输出替换

之前 PostToolUse 只能替换 MCP 工具的输出,现在支持所有工具。

实际应用场景:每次 Claude 写完代码,自动跑 formatter,然后把格式化后的内容替换回去,而不是让 Claude 再改一遍。

{
  "hooks": {
    "PostToolUse": [{
      "matcher": "Write",
      "hooks": [{
        "type": "command",
        "command": "black ${TOOL_OUTPUT_PATH}",
        "hookSpecificOutput": {
          "updatedToolOutput": true
        }
      }]
    }]
  }
}

MCP alwaysLoad:跳过 tool-search deferral

如果你有个 MCP server 是每次必用的(比如我们公司内部的数据查询接口),加这一行让它跳过懒加载,每次 session 启动就直接可用:

{
  "mcpServers": {
    "internal-data": {
      "url": "http://data-mcp.company.internal/sse",
      "alwaysLoad": true
    }
  }
}

/recap:回到遗忘的 session

开着一个任务去开会,回来已经不记得干到哪了。

claude /recap

直接给你一个本次 session 的摘要,告诉你做了什么、正在哪里、下一步应该怎么走。比你自己翻历史记录快多了。


五、踩坑记录:我交过学费的地方

坑一:Mega-Skill 大杂烩

最常见的错误。把所有规范塞进一个 SKILL.md,然后发现 Claude 根本不知道该不该触发它。

正确做法:一个 skill 只管一件事,description 里的触发词要精确。

❌ 所有代码规范(包含 commit、review、测试、文档...)
✅ commit-format(只管提交信息格式)
✅ risk-review(只管风控审查)
✅ test-style(只管测试风格)

坑二:Skill 和 Slash Command 傻傻分不清

它们用的是同一个文件格式。一个 SKILL.md 同时给你:

  • 自动触发的 skill
  • /skill-name 手动调用的 slash command

两个能力免费捆绑,别多创建文件。

坑三:多 Agent 不做 worktree 隔离

用 Agent Teams 跑并行任务,没有 git worktree,两个 agent 同时改同一个文件,冲突解决到你怀疑人生。

git worktree add ../agent-a-workspace feature/agent-a
git worktree add ../agent-b-workspace feature/agent-b

坑四:Dreaming 改了不该改的规则

如果你有严格合规要求,建议把 Dreaming 设置成"人工审核后才落地",不要全自动。金融场景下,AI 自己总结的"规律"可能和你的监管要求冲突。


六、数据说话:我为什么觉得这轮更新很实在

Anthropic 在 Code w/ Claude 2026 大会上给出的数据:

  • API 调用量 17 倍年同比增长
  • Claude Code 每天有工程师跑任务数小时
  • Pro/Max 订阅者每日使用上限从 5 小时提升至 10 小时

这不是营销数据,是实打实的使用量——毕竟开发者是最难哄的一群人,你不好用他们不会用。

从我自己的体感来看,2025 年底到现在,Claude Code 的可靠性提升明显。以前偶尔会出现"明明写了 skill 但没触发"的情况,现在基本稳定了。多 Agent 那一套还在打磨,但已经可以用于生产环境里那些"拆分明确、边界清晰"的任务。


尾声:它不是要替代你,是要替代你的那部分体力活

我用 Claude Code 最深的感悟是:

它最值钱的地方不是会写代码,是它能帮你把那些反复重复的"背景信息传递"自动化掉。

以前我每次让同事帮忙 review 代码,要先花十分钟解释我们系统的约束、公司的规范、当前任务的上下文。Skills 就是把这十分钟省掉的东西。

多 Agent 编排是另一个维度:以前你一次只能跟一个 AI "结对编程",现在你可以指挥一支小队。学会分配任务、定义成功标准(Outcomes)、让 Dreaming 帮你提炼经验,这才是 2026 年用 Claude Code 的正确姿势。

说了这么多,去建你的第一个 skill 吧。我打赌你用一周后就回来感谢我。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐