MCP是AI的“手”,Skills是AI的“脑回路”——一个都不能少
写在前面
昨天我刚刚写完了MCP相关的博客,身边就有朋友问我:“MCP和最近大火的Agent Skills到底什么关系?是不是以后只用Skills就够了?”说实话,这个问题我也纠结过一阵。2026年初,Skills几乎刷屏了整个AI开发者社区,Anthropic、OpenAI、微软纷纷跟进,生态技能数量在短短几个月内突破85,000个,主流支持平台达27家。但Skills究竟从哪来?它和MCP到底谁替代谁?在Agent架构中又扮演什么角色?带着这些问题,我花了三周时间调研和实践,本文将逐一拆解。

一、Skills从哪来?——一段跨越二十六年的技术演进史
Skills这个概念,其实比很多人想象的要老得多。
源头一:强化学习的“选项框架”
1999年,Rich Sutton和他的学生提出了一个叫Options Framework的理论框架。核心想法是:Agent应该能自己发现和组合可复用的行为模块,而不是每次都从零开始、一步一步试。但那个年代的Skill困在神经网络的权重矩阵里,不可解释、不可迁移、不可编辑。你训练出一个“开门”的Skill,想把它用到另一个环境里,几乎不可能。
源头二:Voyager的代码化突破
这个困局持续了24年,直到2023年Jim Fan等人的Voyager项目在Minecraft里把Skill从权重拉到了代码里。在那里,GPT-4驱动的Agent在游戏中自主探索,每学会一个新能力就把它写成一段JavaScript函数,存进Skill Library。结果Voyager获得的独特物品数量是前代最强方法的3.3倍,解锁科技树的速度快了15.3倍。代码形态的Skill意味着它天然可解释、可编辑、可组合、可迁移——这才是26年里真正的拐点。
源头三:Anthropic的标准化推进
2025年10月16日,Anthropic在Claude 3.7中正式推出Claude Skills功能,定位解决通用大模型在垂直场景中“知道但不会做”的问题。两个月后的12月18日,Agent Skills作为开放标准被正式发布,规范与SDK同步上线至agentskills.io。几乎同一时间,微软在VS Code与GitHub中集成了这套标准,Cursor、OpenCode等主流编码Agent纷纷跟进,OpenAI也悄悄在Codex文档中增补了Skills支持。
为什么Anthropic要推这个标准?核心原因在于,大模型厂商发现了一个根本性问题:Agent光有“嘴”不够,还得有“脑子里的专业知识”。 MCP、CLI等工具给Agent装了“手脚”,但脑子里没有专业知识。Skills补的就是这一层——不是“你整体上能调用什么工具”,而是“一件具体的事,你该怎么把事做对”。

二、Skills到底是什么?——一个文件夹,三层加载机制
如果你打开一个Skill文件夹,看到的目录结构大致如下:
my-skill/
├── SKILL.md # 必需:核心指令文档
├── scripts/ # 可选:可执行脚本(Python/Bash等)
├── references/ # 可选:参考文档和规范
└── assets/ # 可选:模板、素材等资源
其中,SKILL.md是唯一必需的文件。它分为两部分:YAML元数据块(name和description,约30-50 tokens)和Markdown指令体(详细的操作流程)。
Skill最精妙的设计在于 “渐进式披露”(Progressive Disclosure) 机制:
-
第一层(元数据层) :Agent启动时只加载每个Skill的name和description,约30-50 tokens。这意味着你可以有100个Skills,启动成本仅3000-5000 tokens,几乎不影响上下文窗口。
-
第二层(指令层) :只有当Agent判断某个Skill与当前任务相关时,才加载完整的SKILL.md内容,约500-5000 tokens。
-
第三层(资源层) :Scripts和references只有在SKILL.md明确指示时才被读取,且不会一次性全部加载。

实测数据显示,在处理长链条业务流程时,这套架构能将上下文Token消耗降低60%-80%。
这里有一个容易被误解的地方:Skill本质上是一个文件夹,不只是Markdown文件。Anthropic内部工程团队将Skill分成了9类,包括库与工具使用、验证技能、数据访问、工作流自动化等,远远超出了“存Prompt的地方”这一认知边界。
三、Skills vs MCP:不是替代,是分工协作
这是社区讨论最多、也最容易混淆的问题。我们直接看最核心的区别:

再看一个具体场景:你要写一份市场分析报告。
-
MCP负责:连接行业数据库获取数据、调用网络爬虫抓取动态、访问API收集信息
-
Skills负责:按照预设的报告结构组织信息、使用分析框架解读数据、采用标准写作风格表达观点
“这就像厨师做菜:MCP提供了各种食材和厨具,Skills提供了烹饪方法和口味偏好。”
一个重要结论:Skills不仅不会取代MCP,二者反而是天然互补的关系。Skills可以直接调用MCP暴露的工具——一个Skill可以在SKILL.md中写明“使用GitHub MCP Server创建PR”,Agent读取这个Skill后,就会通过MCP协议调用GitHub接口。
在架构层面,Skill的定位恰好介于Tool和Agent之间:Tool是操作层,Skill是能力层,Agent是调度层。
四、Skills在Agent中扮演什么角色?——Agent的“手脚说明书”
前面我们用过一张厨师做菜的比喻,但从工程架构的角度,可以把Agent的能力拆解为三层:
-
工具层(Tools) :原子化操作,如“发送HTTP请求”“读取文件”“执行SQL”
-
技能层(Skills) :封装好的做事方法,如“按照OWASP标准做代码安全审查”“生成符合团队规范的PPT”
-
调度层(Agent) :理解用户目标,规划步骤,决定调用哪个Skill

如果缺少Skills这一层,Agent的逻辑会非常脆弱:要么直接调用Tool,太底层、太零碎;要么把一堆逻辑塞进System Prompt,一长就失灵、一改就崩。Skill通过结构化封装解决了这三个痛点:
-
职责单一:每个Skill只专注一件事
-
可测试:Skill的输入输出可以像函数一样写测试
-
可组合:复杂任务可由多个Skill协作完成
把话说得更直白一点:如果说大模型是新的计算单元,Multi-Agents框架是新的操作系统,那么Agent Skills就是智能体的.apk,是AI领域的Docker镜像。
截至2026年初,公开可用的Agent Skills已超过85,000个,支持标准的主流平台达27家,Linux基金会也已启动讨论,拟将Agent Skills纳入其AI & Data基金会的候选标准之一。社区中甚至还出现了EvoSkill这样的自我进化系统——通过失败分析自动发现并优化Skills,使Agent在OfficeQA金融文档问答任务上准确率从60.6%提升至67.9%,在SealQA对抗性搜索问答上实现了12.1个百分点的提升。
这意味着,Skill正在从一个“静态的能力包”演变为“可以自进化、自优化的能力资产”。未来的AI Agent,不再靠人工一点一点调教,而是靠Skill库的持续迭代和进化。
五、实践建议:什么时候该写Skill,什么时候该配MCP?
基于我的调研和少量实践,给出三条实用的判断准则:
✅ 适合写Skill的场景:
-
你有重复性的工作流程(如代码审查、周报生成、文档格式转换)
-
团队有一套固定的操作规范(如安全审计流程、发布前检查清单)
-
你希望AI在跨对话中保持一致的行为标准
✅ 适合配MCP的场景:
-
你需要访问外部系统和数据(GitHub、数据库、Slack API)
-
需要实时获取最新信息(股价、天气、新闻)
-
工具本身已经以API形式存在,只需要一个标准化的接入层
✅ 最佳实践是“Skills + MCP”混合架构:
-
用MCP接入外部能力
-
用Skills定义如何使用这些能力
-
Agent作为调度层,在两者的协作下完成任务
以Anthropic官方PDF Skill为例:它既包含SKILL.md定义处理PDF的步骤和逻辑,又可以调用MCP暴露的文件系统接口来读取和写入PDF文件。

总结
Agent Skills的演进,本质上是从“权重内隐式记忆”到“代码化显式知识”的范式转移。1999年Options Framework把Skill困在权重矩阵里;2023年Voyager用代码把Skill解放出来;2025年Anthropic用标准化将其推向生态——这条二十六年的演进路线,折射出AI能力工程化的清晰方向。
Skill与MCP的关系,用一个最简洁的公式可以概括:MCP负责“手脚”,Skills负责“说明书” 。前者解决AI能不能连接到外部世界,后者解决AI能不能按你的标准把事情做对。二者不是替代关系,而是分工协作、共同构成Agent完整能力体系的两大支柱。
对于正在构建RAG知识库或AI应用的开发者来说,Skills提供了一条极低门槛的路径——你不需要写复杂的MCP Server,一个Markdown文件就能让Agent学会按你的方式做事。而随着Skill生态突破85,000个技能、跨平台支持持续扩张,它正在成为AI应用开发中不可或缺的基础设施层。
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐


所有评论(0)