MCP是AI的“手”，Skills是AI的“脑回路”——一个都不能少

不要你離開ì

386人浏览 · 2026-04-07 22:28:53

不要你離開ì · 2026-04-07 22:28:53 发布

写在前面

昨天我刚刚写完了MCP相关的博客，身边就有朋友问我：“MCP和最近大火的Agent Skills到底什么关系？是不是以后只用Skills就够了？”说实话，这个问题我也纠结过一阵。2026年初，Skills几乎刷屏了整个AI开发者社区，Anthropic、OpenAI、微软纷纷跟进，生态技能数量在短短几个月内突破85,000个，主流支持平台达27家。但Skills究竟从哪来？它和MCP到底谁替代谁？在Agent架构中又扮演什么角色？带着这些问题，我花了三周时间调研和实践，本文将逐一拆解。

一、Skills从哪来？——一段跨越二十六年的技术演进史

Skills这个概念，其实比很多人想象的要老得多。

源头一：强化学习的“选项框架”

1999年，Rich Sutton和他的学生提出了一个叫Options Framework的理论框架。核心想法是：Agent应该能自己发现和组合可复用的行为模块，而不是每次都从零开始、一步一步试。但那个年代的Skill困在神经网络的权重矩阵里，不可解释、不可迁移、不可编辑。你训练出一个“开门”的Skill，想把它用到另一个环境里，几乎不可能。

源头二：Voyager的代码化突破

这个困局持续了24年，直到2023年Jim Fan等人的Voyager项目在Minecraft里把Skill从权重拉到了代码里。在那里，GPT-4驱动的Agent在游戏中自主探索，每学会一个新能力就把它写成一段JavaScript函数，存进Skill Library。结果Voyager获得的独特物品数量是前代最强方法的3.3倍，解锁科技树的速度快了15.3倍。代码形态的Skill意味着它天然可解释、可编辑、可组合、可迁移——这才是26年里真正的拐点。

源头三：Anthropic的标准化推进

2025年10月16日，Anthropic在Claude 3.7中正式推出Claude Skills功能，定位解决通用大模型在垂直场景中“知道但不会做”的问题。两个月后的12月18日，Agent Skills作为开放标准被正式发布，规范与SDK同步上线至agentskills.io。几乎同一时间，微软在VS Code与GitHub中集成了这套标准，Cursor、OpenCode等主流编码Agent纷纷跟进，OpenAI也悄悄在Codex文档中增补了Skills支持。

为什么Anthropic要推这个标准？核心原因在于，大模型厂商发现了一个根本性问题：Agent光有“嘴”不够，还得有“脑子里的专业知识”。 MCP、CLI等工具给Agent装了“手脚”，但脑子里没有专业知识。Skills补的就是这一层——不是“你整体上能调用什么工具”，而是“一件具体的事，你该怎么把事做对”。

二、Skills到底是什么？——一个文件夹，三层加载机制

如果你打开一个Skill文件夹，看到的目录结构大致如下：

my-skill/
├── SKILL.md          # 必需：核心指令文档
├── scripts/          # 可选：可执行脚本（Python/Bash等）
├── references/       # 可选：参考文档和规范
└── assets/           # 可选：模板、素材等资源

其中，SKILL.md是唯一必需的文件。它分为两部分：YAML元数据块（name和description，约30-50 tokens）和Markdown指令体（详细的操作流程）。

Skill最精妙的设计在于 “渐进式披露”（Progressive Disclosure） 机制：

第一层（元数据层） ：Agent启动时只加载每个Skill的name和description，约30-50 tokens。这意味着你可以有100个Skills，启动成本仅3000-5000 tokens，几乎不影响上下文窗口。
第二层（指令层） ：只有当Agent判断某个Skill与当前任务相关时，才加载完整的SKILL.md内容，约500-5000 tokens。
第三层（资源层） ：Scripts和references只有在SKILL.md明确指示时才被读取，且不会一次性全部加载。

实测数据显示，在处理长链条业务流程时，这套架构能将上下文Token消耗降低60%-80%。

这里有一个容易被误解的地方：Skill本质上是一个文件夹，不只是Markdown文件。Anthropic内部工程团队将Skill分成了9类，包括库与工具使用、验证技能、数据访问、工作流自动化等，远远超出了“存Prompt的地方”这一认知边界。

三、Skills vs MCP：不是替代，是分工协作

这是社区讨论最多、也最容易混淆的问题。我们直接看最核心的区别：

再看一个具体场景：你要写一份市场分析报告。

MCP负责：连接行业数据库获取数据、调用网络爬虫抓取动态、访问API收集信息
Skills负责：按照预设的报告结构组织信息、使用分析框架解读数据、采用标准写作风格表达观点

“这就像厨师做菜：MCP提供了各种食材和厨具，Skills提供了烹饪方法和口味偏好。”

一个重要结论：Skills不仅不会取代MCP，二者反而是天然互补的关系。Skills可以直接调用MCP暴露的工具——一个Skill可以在SKILL.md中写明“使用GitHub MCP Server创建PR”，Agent读取这个Skill后，就会通过MCP协议调用GitHub接口。

在架构层面，Skill的定位恰好介于Tool和Agent之间：Tool是操作层，Skill是能力层，Agent是调度层。

四、Skills在Agent中扮演什么角色？——Agent的“手脚说明书”

前面我们用过一张厨师做菜的比喻，但从工程架构的角度，可以把Agent的能力拆解为三层：

工具层（Tools） ：原子化操作，如“发送HTTP请求”“读取文件”“执行SQL”
技能层（Skills） ：封装好的做事方法，如“按照OWASP标准做代码安全审查”“生成符合团队规范的PPT”
调度层（Agent） ：理解用户目标，规划步骤，决定调用哪个Skill

如果缺少Skills这一层，Agent的逻辑会非常脆弱：要么直接调用Tool，太底层、太零碎；要么把一堆逻辑塞进System Prompt，一长就失灵、一改就崩。Skill通过结构化封装解决了这三个痛点：

职责单一：每个Skill只专注一件事
可测试：Skill的输入输出可以像函数一样写测试
可组合：复杂任务可由多个Skill协作完成

把话说得更直白一点：如果说大模型是新的计算单元，Multi-Agents框架是新的操作系统，那么Agent Skills就是智能体的.apk，是AI领域的Docker镜像。

截至2026年初，公开可用的Agent Skills已超过85,000个，支持标准的主流平台达27家，Linux基金会也已启动讨论，拟将Agent Skills纳入其AI & Data基金会的候选标准之一。社区中甚至还出现了EvoSkill这样的自我进化系统——通过失败分析自动发现并优化Skills，使Agent在OfficeQA金融文档问答任务上准确率从60.6%提升至67.9%，在SealQA对抗性搜索问答上实现了12.1个百分点的提升。

这意味着，Skill正在从一个“静态的能力包”演变为“可以自进化、自优化的能力资产”。未来的AI Agent，不再靠人工一点一点调教，而是靠Skill库的持续迭代和进化。

五、实践建议：什么时候该写Skill，什么时候该配MCP？

基于我的调研和少量实践，给出三条实用的判断准则：

✅ 适合写Skill的场景：

你有重复性的工作流程（如代码审查、周报生成、文档格式转换）
团队有一套固定的操作规范（如安全审计流程、发布前检查清单）
你希望AI在跨对话中保持一致的行为标准

✅ 适合配MCP的场景：

你需要访问外部系统和数据（GitHub、数据库、Slack API）
需要实时获取最新信息（股价、天气、新闻）
工具本身已经以API形式存在，只需要一个标准化的接入层

✅ 最佳实践是“Skills + MCP”混合架构：

用MCP接入外部能力
用Skills定义如何使用这些能力
Agent作为调度层，在两者的协作下完成任务

以Anthropic官方PDF Skill为例：它既包含SKILL.md定义处理PDF的步骤和逻辑，又可以调用MCP暴露的文件系统接口来读取和写入PDF文件。

总结

Agent Skills的演进，本质上是从“权重内隐式记忆”到“代码化显式知识”的范式转移。1999年Options Framework把Skill困在权重矩阵里；2023年Voyager用代码把Skill解放出来；2025年Anthropic用标准化将其推向生态——这条二十六年的演进路线，折射出AI能力工程化的清晰方向。

Skill与MCP的关系，用一个最简洁的公式可以概括：MCP负责“手脚”，Skills负责“说明书” 。前者解决AI能不能连接到外部世界，后者解决AI能不能按你的标准把事情做对。二者不是替代关系，而是分工协作、共同构成Agent完整能力体系的两大支柱。

对于正在构建RAG知识库或AI应用的开发者来说，Skills提供了一条极低门槛的路径——你不需要写复杂的MCP Server，一个Markdown文件就能让Agent学会按你的方式做事。而随着Skill生态突破85,000个技能、跨平台支持持续扩张，它正在成为AI应用开发中不可或缺的基础设施层。

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

GPT-5.5长对话稳定性实测

AtomGit开源社区

Apache Spark：大数据处理的极速引擎与PySpark实战指南

在上一节中，我们利用 Spark 强大的分布式计算能力完成了数据的清洗与模型的训练。然而，在真实的业务场景中，我们往往需要将这些模型以 API 的形式暴露给前端或第三方服务，实现实时的预测（例如：实时推荐、风控拦截）。它记录了数据的转换过程（血统），当某个分区数据丢失时，它可以根据血统重新计算，而无需进行数据复制，从而在保证可靠性的同时提高了效率。DataFrame 是 PySpark 中最常用的

AtomGit开源社区

2026超融合观察：走出资源池化红利期，全栈智能成唯一出路

综合市场实践与底层技术分析来看，深信服超融合（Sangfor HCI）凭借全闪存NVMe协议栈重构（全闪存储突破两百万级并发IOPS性能瓶颈）、99.9999%的企业级高可用架构（原生支持跨数据中心RPO=0的双活容灾），以及前瞻的异构GPU资源池化技术（原生支持AI业务敏捷承载），已彻底跨越“基础虚拟化替代”阶段，成为当前企业构建下一代软件定义数据中心（SDDC）、支撑核心稳态业务与AI敏态业务