【Claude】Skill Creator 实战技巧,一文讲明白究竟怎么生成skill
一句话说清楚
Skill = 你写给 AI 的一份"操作手册",让它干某类活时不再瞎搞。
Skill Creator = 帮你写这份手册的助手。你说需求,它写手册、测试、改进,直到好用为止。
一个 Skill 长什么样?
就是一个文件夹,核心是一个叫 SKILL.md 的文件:
周报生成器/
├── SKILL.md ← 核心!"手册"正文
├── scripts/ ← 可选:辅助脚本
└── references/ ← 可选:参考资料
SKILL.md 的基本格式:
---
name: weekly-report
description: 生成格式化周报。当用户提到周报、
本周总结、工作汇报时使用此技能。
---
# 这里写具体指令
# 告诉 AI 怎么干活
就两部分:头部(名字+什么时候用)和正文(怎么干活)。
整个流程怎么跑的?
聊需求 → 写草稿 → 跑测试 → 你来看效果 → 改进
↑ 不满意就一直循环,直到你说 OK
// SKILL.md 第10-20行说的就是这个循环:
- 想清楚要让 AI 干嘛
- 写一版草稿
- 拿几个测试例子去跑
- 看看结果好不好
- 根据反馈改进
- 重复,直到满意
第一步:聊需求
Skill Creator 会问你几个关键问题:
// 它会问你:
1. 你想让 AI 干什么?
2. 什么情况下应该触发这个技能?
3. 输出应该是什么样子?
4. 要不要搞测试用例来验证?
举个例子 —— 你想做"周报生成器":
你: 我想让 AI 帮我写周报,我告诉它这周干了啥,它帮我整理成格式化的周报
Skill Creator: 周报格式有模板吗?要分哪几个板块?语气正式还是随意?
你: 分"本周完成"、“下周计划”、"风险"三块,语气正式点
聊清楚后,进入下一步。
第二步:写草稿
Skill Creator 根据你的需求写出 SKILL.md。
有个重要细节:description 字段要写得"积极主动"一些。
// AI 天生有点"懒",不太愿意主动调用技能
// 所以描述要写得覆盖面广一点,多列几种触发场景
| 示例 | |
|---|---|
| 不好 | “帮助生成周报” |
| 好 | “生成格式化周报。当用户提到周报、本周总结、工作汇报、甚至说’帮我整理下这周干了啥’时都触发” |
第三步:跑测试
这步做的事情很简单:拿几句话去试,看 AI 干得好不好。
先造测试用例
模拟真实用户会怎么说:
// 假装自己是用户,写几种不同的说法:
1. "帮我写个周报,这周修了登录的bug,还做了用户反馈页面"
2. "整理下这周工作,主要做了代码评审和迭代规划"
3. "老板要周报,我这周净开会了,还有几个线上问题"
然后做对比实验
| 对照组 | 实验组 |
|---|---|
| 不带技能的 AI | 带着你的技能的 AI |
| → 看"裸奔"出来什么效果 | → 看加了手册后好了多少 |
就像药物临床试验:一组吃药,一组吃安慰剂,对比效果差异。
第四步:你来看效果
测试跑完后,会打开一个网页让你看结果:
- 左边是"没技能"的输出,右边是"有技能"的输出
- 你逐条看,觉得哪里不好就写评语
- 觉得没问题的直接跳过
- 看完点"提交"
你可能会写这样的反馈:
测试1:"格式不错,但语气太正式了,像给甲方写的"
测试2:(空 = 你觉得OK)
测试3:"风险那块写得太敷衍了,应该具体说是什么问题"
第五步:改进
根据你的反馈修改 SKILL.md,然后重新跑测试。
改进时有 4 个原则:
1. 别太死板
// 测试只有几个例子,但技能要能应对无数场景
// 不能为了通过测试写死板的规则
| 示例 | |
|---|---|
| 坏 | “如果用户提到’登录bug’就归类到安全相关”(太死了,换个词就不灵了) |
| 好 | “根据工作内容的性质自动归类到合适的方向”(灵活通用) |
2. 没用的就删
// 如果某条指令对结果没啥帮助,删掉它
// 手册越精简,AI 执行得越好
3. 说原因,别只说"必须"
| 示例 | |
|---|---|
| 坏 | “必须用列表格式!禁止用段落!必须加表情!”(AI不理解为什么) |
| 好 | “周报的读者是忙碌的老板,他们要快速扫一眼就抓住重点,所以用要点列表比长段落好”(AI理解了,举一反三) |
4. 重复的工作抽成脚本
// 如果每次测试都发现 AI 在重复写同样的辅助代码
// 那就写好放到 scripts/ 文件夹里,让它直接用
// 比如:每次都要解析 git 记录,那就写一个现成的脚本
收尾:优化触发词
技能做好了,还要确保 AI “知道什么时候该用它”。
手册写好了还不够,得贴好标签。标签越准,AI 越能在对的时候拿出来用。
怎么优化?造 20 个测试句子:
// 10 句"应该触发"的(各种说法):
"帮我把这周干的事整理成周报发给老板"
"这周的工作汇报帮我写一下"
"整理下本周工作内容"
// 10 句"不应该触发"的(容易混淆的):
"帮我写个项目文档" ← 不是周报!
"总结一下这次代码改动" ← 是代码总结!
然后自动跑 5 轮优化,找到最准确的描述。
// 自动把 20 个句子分成"训练集"和"测试集"
// 反复调整 description,让触发准确率最高
// 用测试集的分数来选最好的版本(防止过拟合)
补充:为什么分三层?
AI 的"注意力"有限(不能同时记住太多东西),所以技能分三层加载:
// 三层加载机制:
第1层:名字 + 简介(永远在 AI 视野里,约100字)
第2层:手册正文(触发技能时才加载,建议500行以内)
第3层:附带资料(需要时才去查,不限大小)
就像你的书架:
- 第1层 = 书脊上的书名(一眼扫到,决定要不要拿下来看)
- 第2层 = 翻开书(要用的时候才看)
- 第3层 = 书里的附录(需要细节时才翻到后面)
完整例子:做一个"周报生成skill"
聊需求
直接告诉claude,创建一个周报(cladue会开始思考):
写草稿
他会在
~\.claude\skills目录下生成一版你要的内容:
改进(多轮)
把不符合你要求的内容改掉(直接告诉它就行了,不要直接改skill文件)
第二轮:
测试看效果
准备测试数据,看结果:
> 用 下面内容测试周报skill: 周一 • 整理并同步上周未完成的需求文档,和产品对齐本周优先级 • 修复首页 Banner 在移动端适配异常的问题(Safari / iOS 端) • 参与需求评审会,评估活动页开发周期与技术风险 • 优化本地开发环境配置,升级 pnpm & node 版本 周二 • 活动页静态页面还原(基于 Figma 设计稿) • 封装通用弹窗组件,支持异步关闭与多类型提示 ... 周五 ...
继续改进
这时候如果你还是觉得生成内容不合适,你就继续让它改skill,直到满意为止。
总结
聊需求 → 写手册 → 测试 → 看效果 → 改 → 循环 → 交付
本质就是:把"教 AI 干活"这件事,变成了一个可以反复试、反复改的流程。不是写一次就完了,而是像训练员工一样,练到好用为止。
什么时候该用它?
- 你有个重复性的活,想让 AI 每次都按你的标准来
- 你发现自己每次都在重复输入差不多的话
- 你想把自己的经验"教"给 AI
- 你需要 AI 输出严格按某个格式走
不太适合: 只用一次的任务,或者纯主观创作(比如写诗 —— 好坏没法量化)
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐







所有评论(0)