关注 霍格沃兹测试学院公众号,回复「资料」, 领取人工智能测试开发技术合集

最近 Anthropic 官方发布了一份 33 页的 Claude Skills 构建指南

很多人看到这个消息时的第一反应是:

Skills 不就是 Prompt 模板吗?

如果只是这么理解,那就低估它了。

这份指南其实透露了一件更大的事情:

AI 应用的开发方式正在发生变化。

过去几年,大多数 AI 应用是这样的:

用户 → Prompt → LLM → 输出

但现在越来越多 AI 系统开始变成:

用户 → Agent → Skills → 工具 → 结果

也就是说:

Prompt 在减少,能力模块在增加。

Anthropic 的这份 Skills 指南,本质是在告诉开发者:

如何把 AI 能力做成模块化系统。


目录

  • 1 Claude Skills 到底是什么

  • 2 Skills 的核心设计思想

  • 3 Skills 的工程结构

  • 4 Skills + MCP 的 Agent 架构

  • 5 Skills 的五种设计模式

  • 6 Skills 如何测试

  • 7 Prompt工程 vs Agent工程

  • 8 AI Agent 技术栈

  • 9 为什么 Skills 会成为 Agent 的核心能力


1 Claude Skills 到底是什么

Anthropic 的官方定义其实很简单:

Skill = 一组可复用的任务流程。

本质上,它就是一个 能力模块

一个 Skill 的典型结构是:

your-skill-name/

SKILL.md
scripts/
references/
assets/

其中最重要的是:

SKILL.md

这个文件包含:

  • YAML 元信息

  • 技能描述

  • 执行步骤

  • 示例

  • 错误处理

例如:

---
name: sprint-planning
description:
  自动规划项目冲刺任务
  当用户说“规划冲刺”“创建任务”时使用
---

执行流程:

1 获取项目状态
2 分析团队容量
3 建议任务优先级
4 创建任务

简单来说:

Skill = 把经验封装成模块。

2 Skills 的核心设计思想

Anthropic 在文档中提出了三个核心理念。


1 渐进式加载

Skill 不会一次性加载全部内容。

而是三层结构:

Layer1  YAML metadata
Layer2  SKILL.md
Layer3  references

加载流程如下:

图片

这种设计带来的好处:

  • 节省 token

  • 保留复杂知识

  • 降低上下文污染


2 可组合性

Claude 可以 同时加载多个 Skills

例如:

design-skill
coding-skill
analysis-skill
report-skill

一个 Agent 任务中可能变成:

Agent
 ├ design skill
 ├ coding skill
 └ report skill

所以设计 Skill 时必须注意:

不要假设自己是唯一技能。


3 可移植性

同一个 Skill 可以运行在:

  • Claude.ai

  • Claude Code

  • API

  • Agent 系统

也就是说:

写一次,到处使用。


3 Skills 的工程结构

官方推荐的工程结构如下:

skill-name
│
├── SKILL.md
├── scripts
├── references
└── assets

每个组件的作用:

组件

作用

SKILL.md

核心逻辑

scripts

自动执行脚本

references

知识文档

assets

模板资源

一个 Skill 的典型执行流程:

图片


4 Skills + MCP 的 Agent 架构

如果说:

MCP 是连接层

那么:

Skills 就是知识层。

架构如下:

图片

一句话总结:

MCP 解决:AI 能做什么
Skills 解决:AI 应该怎么做

5 Skills 的五种设计模式

Anthropic 总结了五种常见设计模式。


1 顺序工作流

适合:

多步骤自动化任务。

创建账户
↓
设置支付
↓
创建订阅
↓
发送欢迎邮件

2 多 MCP 协同

例如设计交接流程:

图片


3 迭代优化

适合:

报告生成、数据分析。

生成初稿
↓
质量检查
↓
修改
↓
重新验证

4 情境工具选择

大文件 → 云存储
协作文档 → Notion
代码文件 → GitHub

5 领域知识 Skill

例如金融风控系统:

  • 风险规则

  • 合规流程

  • 审计记录

都可以嵌入 Skill 中。


6 Skills 如何测试

官方给出三种测试方式。


1 触发测试

验证 Skill 是否正确触发。

例如:

应该触发:

帮我创建项目
帮我规划冲刺
创建任务

不应该触发:

今天天气
写Python脚本

2 功能测试

验证任务是否成功执行。

例如检查:

任务是否创建
参数是否正确
MCP调用是否成功

3 对比测试

比较:

无 Skill
vs
有 Skill

官方示例:

指标

无技能

有技能

消息数

15

2

API错误

3

0

token消耗

12000

6000


7 Prompt工程 vs Agent工程

这张图最能说明问题:

图片

对比:

传统AI应用
Prompt → LLM → 输出

Agent系统
Agent → Skills → 工具 → 结果

8 AI Agent 技术栈

如果从系统架构看,AI Agent 的技术栈大致如下:

图片

系统分层:

用户
↓
Agent
↓
Skills
↓
MCP
↓
外部系统

9 为什么 Skills 会成为 Agent 的核心能力

Prompt 最大的问题是:

经验无法沉淀。

每次都要重新写。

但 Skills 可以:

把经验封装成能力模块

例如:

coding-skill
analysis-skill
report-skill
design-skill

未来 AI 系统很可能变成:

图片

也就是:

Agent
+ Skills
+ MCP
+ Tools

这非常像软件系统:

操作系统
+ 函数库
+ 插件

结语

Anthropic 发布 Skills 指南,其实透露出一个非常清晰的趋势:

AI 正在从“聊天系统”变成“能力系统”。

未来 AI 工程的核心很可能不再是:

Prompt Engineering

而是:

Agent Engineering

在这种架构下:

  • Skills 是能力模块

  • MCP 是工具连接层

  • Agent 是调度系统

如果你正在做:

  • AI Agent

  • 自动化系统

  • MCP工具

  • 企业AI应用

那么 Skills 这种能力封装方式,很可能会成为 下一代 AI 工程的重要模式

关于我们

霍格沃兹测试开发学社,隶属于 测吧(北京)科技有限公司,是一个面向软件测试爱好者的技术交流社区。

学社围绕现代软件测试工程体系展开,内容涵盖软件测试入门、自动化测试、性能测试、接口测试、测试开发、全栈测试,以及人工智能测试与 AI 在测试工程中的应用实践

我们关注测试工程能力的系统化建设,包括 Python 自动化测试、Java 自动化测试、Web 与 App 自动化、持续集成与质量体系建设,同时探索 AI 驱动的测试设计、用例生成、自动化执行与质量分析方法,沉淀可复用、可落地的测试开发工程经验。

在技术社区与工程实践之外,学社还参与测试工程人才培养体系建设,面向高校提供测试实训平台与实践支持,组织开展 “火焰杯” 软件测试相关技术赛事,并探索以能力为导向的人才培养模式,包括高校学员先学习、就业后付款的实践路径。

同时,学社结合真实行业需求,为在职测试工程师与高潜学员提供名企大厂 1v1 私教服务,用于个性化能力提升与工程实践指导。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐