AI 知识与工具全景汇总

本文档整合了多份关于 AI 工具演进、Skill 机制解析、产品经理工作流、实战安装教程及企业落地实践的核心知识,旨在为从个人开发者到企业业务人员提供一站式的 AI 应用参考。


第一部分:AI 工具演进与生态概览

1.1 2025 → 2026 工具演进对比
领域分类 2025年工具 2026年工具 演进趋势
编程 Cursor Claude Code 从通用工具向深度AI集成演进
助理 Manus Openclaw 从通用型向垂直场景深化
UI设计 Figma Pencil 从专业软件向轻量AI原生迁移
品牌设计 Photoshop Lovart 传统软件被AI驱动工具替代
图片创作 Midjourney Nano Banana Pro 图像生成工具持续专业化
视频创作 Sora Seedance 2.0 视频生成工具快速迭代
PPT Powerpoint NotebookLM 从演示工具向知识管理转型
表格 Excel Rows 数据处理云端化、AI化
浏览器 Chrome Atlas 浏览器成为AI智能入口
AI建站 Wordpress Lovable 零代码AI建站成为主流

核心洞察:

  • AI原生工具全面替代传统工具叠加AI功能的模式。
  • 各领域从通用走向垂直专用化。
  • 传统巨头(Adobe、Google、Microsoft)正被新兴AI工具挑战。

第二部分:AI 核心基础概念

在深入探讨具体工具之前,理解几个核心概念至关重要。它们是构建强大AI应用的基础,特别是理解后续的Skill机制。

2.1 Token:AI的“语言基本单位”

Token是大语言模型处理文本的最小语义单位(可以是字、词、标点或词根)。它直接影响成本与能力。

  • 换算:1个中文字 ≈ 1 Token;1个英文单词 ≈ 1-2 Tokens。
  • 作用:API调用按Token计费,模型的上下文窗口也以Token数量衡量,决定了单次能处理的信息量上限。
  • 意义:理解Token有助于优化提示词,控制成本,并理解为何“按需加载”的Skill机制如此高效。
2.2 Skills、Spec 与 Agent:协同工作的“铁三角”

在AI编程与自动化领域,这三个概念共同构成了一个完整的执行体系。

  • Skills (技能):AI的“职业技能包”,是**“怎么做”**(执行能力)的标准化手册。它封装了特定领域的工作流和知识,让AI能专业地完成某项任务。
  • Spec (规格说明):项目的“设计图纸”,是**“做什么”**(需求定义)的精确描述。它定义了目标、约束和验收标准。
  • Agent (智能体):拥有决策能力的“数字员工”,是**“谁来做”**(自主执行者)。它能够理解高层目标,自主规划步骤,并调用Skills来执行任务,同时遵循Spec的指引。

三者协同工作流:
当Agent接收到一个目标(如“创建一个电商网站”)时,它会参考Spec(需求文档)明确具体要建什么,然后拆解任务,调用对应的Skills(如frontend-design、backend-api-builder)来一步步构建,最终交付成果。

2.3 MCP 与 Skill:深度对比(能力层 vs 规范层)

MCP(模型上下文协议)和Skill是当前AI生态中两个极易混淆但互补的核心概念。理解它们的区别是设计高效AI工作流的关键。

对比维度 MCP (模型上下文协议) Skill
本质定位 能力供给层(工具接口) 行为规范层(流程手册)
核心作用 让AI能连接外部数据源和工具(如数据库、API)。 让AI知道如何专业、规范地使用工具完成任务。
类比 给AI**“手和眼”**(能拿数据、能干活)。 给AI**“经验和方法论”**(知道怎么干活才专业)。
解决问题 “模型能调用什么工具?” “模型该怎么正确使用这些工具?”
实现方式 协议 + Server(需编程部署)。 Markdown文件(纯文档,无需编程)。
执行模型 确定性API调用,固定输入输出。 LLM解释自然语言,结果有一定灵活性。
数据新鲜度 实时,动态获取外部最新信息。 静态,知识固化在文档中,需手动更新。
典型场景 查询实时订单、创建GitHub Issue、发送邮件。 执行代码审查流程、生成标准周报、遵循品牌设计规范。

核心结论:MCP和Skill是协作而非替代关系。 一个强大的AI Agent = 通用模型(大脑) + MCP(工具包) + Skill(经验手册)。Skill负责指挥“在什么场景用什么工具”,MCP负责执行“实际去调用那个工具”。


第三部分:Skill 核心机制深度解析

3.1 Skill 的核心定义
  • 本质:教 AI 做事的结构化工作流说明书,类比给 AI 制定的 SOP
  • 作用:实现从“聊天式协助”到“自动化执行”的转变。
  • 构成:提示词 + 资源 + 脚本 的完整封装。
  • 物理结构:本质上是一个包含 SKILL.md 核心指令文件的文件夹。
3.2 Skill 成为 AI 核心的原因
  • 模型能力只是基础设施:大模型如同高学历实习生,若无业务流程指导,无法转化为生产力。
  • Skill 封装复杂工作流:将多步骤任务封装为单一指令。
  • 支持内置资源与脚本:可实现端到端自动化(如自动发布公众号)。
3.3 三级信息加载系统(官方最佳实践)
  • 第一层(简介):1-2句话说明用途,让AI快速判断是否需要调用,减少无效调用。
  • 第二层(详细步骤):结构化执行流程 + 案例,明确执行标准。
  • 第三层(边界情况):常见问题 + 解决方案,提升容错性。
  • 优势:按需加载节省Token、提升效率、便于迭代维护。

第四部分:各场景下的核心 Skill 推荐

4.1 AI产品经理从0到1全流程 Skill
阶段 Skill名称 核心作用
方案发散 brainstorming skill 资深顾问式追问,梳理模糊想法,输出完整设计文档。
PRD撰写 write-a-prd 访谈式追问,暴露逻辑漏洞,输出专业PRD。
研发对齐 writing-plans-skill 拆解为极细颗粒度执行计划(2-5分钟/步骤)。
上线准备 analytics-tracking 以决策为导向的数据埋点设计。
上线准备 ab-test-setup 自动化样本量计算、假设框架、指标选定。
新用户激活 onboarding-cro 围绕Aha时刻设计激活流程,提升留存转化。
4.2 Agent全栈开发必备 Skill
分类 Skill 作用
必装基础 skill-creator 官方工具,通过对话创建自定义Skill。
必装基础 planning-with-files 解决长对话遗忘上下文,任务进度写入文件。
前端开发 frontend-design 处理字体、颜色、动效细节。
代码质量 security-review 认证、支付功能安全漏洞检查。
代码质量 tdd-workflow 强制测试驱动开发,覆盖率80%+。
4.3 6个底座级核心 Skill(OpenClaw生态)
Skill 核心能力 价值定位
agent-browser 浏览器自动化(点击、填表、截图) 给AI装上“一双手”。
heavily search AI专属联网搜索(无广告、结构化) 让AI获取实时有效信息。
self-improving agent 记忆风格、从错误中学习、跨会话保持 AI越用越贴合用户。
find skills 自然语言匹配Skill、批量管理、版本控制 上万个Skill的精准发现与管理。
skill-vendor 安装前安全扫描、恶意代码检测 给工具链装“门禁”。
email-management 全平台邮件代读、代写、自动分类 邮件处理全流程自动化。

第五部分:OpenCode + Skill 实战指南

5.1 安装与配置
  1. 安装OpenCode:通过npm指令安装(需Node环境)。
  2. 绑定模型:在终端输入 connect,搜索并粘贴智谱等模型的API Key。
  3. 验证:输入 /models 验证绑定成功。
5.2 核心操作能力
  • 全局规则:设置“始终用中文回复”等基础规则。
  • 本地文件操作:文件查找、修改、创建、代码编写。
  • 双模式切换:Play模式(仅规划)/ Build模式(执行修改)。
5.3 Skill 接入与创建
  • 接入:从官方仓库下载Skill包,解压到项目文件夹(如 .open code/skills/),AI即可自动识别和调用。
  • 手动创建
    1. 新建文件夹(如 making-summary)。
    2. 创建 skill.md,头部用yaml格式填写namedescription
    3. 编写执行要求(如“纪要最后必须包含歇后语”)。
    4. 将文件夹放入OpenCode的Skill路径。
5.4 Skill 原理:按需加载 + 渐进式披露

与每次调用都完整加载的MCP不同,Skill更高效:

  • 按需加载:模型最初仅可见Skill的“简介”,具体指令在调用时才加载。
  • 渐进式披露referencesscripts等内容满足条件后才触发执行。

第六部分:企业 AI 落地最优单元

6.1 核心结论

Agent的Skill是企业AI落地的最优单元,它完美地结合了业务知识与技术执行。

6.2 传统痛点 vs Skill 优势
痛点 Skill 解决方案
业务人员不懂代码 零代码,业务人员可直接将SOP打造成Skill。
IT人员不懂业务 业务人员自行封装SOP,无需IT中转。
工作流搭建周期长(1-2周) Skill打造压缩至分钟级别
难以达到生产级别 可重复调用,搭配MCP拓展能力边界。
6.3 实际案例:教育机构教研工作
  • 做课流程:通过“课程大纲+逻辑稿 Skill”自动生成内容 → “PPT配图 Skill”调用API自动配图 → “质检替换 Skill”自动检测敏感词。
  • 拆课流程(2-3小时视频压缩至十几分钟):结合浏览器自动化MCP和“视频获取 Skill”提取字幕 → “PPT截图 Skill”智能筛选关键帧 → “课程分析 Skill”自动输出分析结论。
6.4 企业落地核心价值
  1. 释放业务人员潜力:90%以上零代码基础的业务人员可将SOP工具化。
  2. 构建复用系统:每个人打造“Agent+Skill”系统,Agent按需自动调用。
  3. 指数级提升效率:从“高门槛难以推进”到“触手可得”。

第七部分:核心认知与避坑指南

7.1 Skill 的核心价值
  • Skill 是 AI 的灵魂:从“聊天机器人”升级为“数字员工”。
  • 门槛不是技术,而是业务理解:Skill 放大的是使用者已有的能力。
  • 不可复制的长期资产:模型会被追平,工具会过时,但Skill沉淀的工作流可跨平台复用。
7.2 关键避坑
误区 正确认知
有了Skill就能一键躺赚 价值取决于业务理解,梳理不清工作流则无法发挥。
盲目追逐新工具 沉淀专属Skill体系才是核心竞争力。
直接使用他人Skill 他人Skill无法适配个人工作风格,需亲自构建微调。
7.3 行动建议
  1. 梳理自己每天重复做的3件工作。
  2. 选择OpenClaw或Claude Code作为入门工具。
  3. 从最简单的一个重复场景入手,构建第一个Skill。
  4. 经历“生成 → 测试 → 修改 → 再测试”的循环,让Skill逐步成熟。
  5. 企业人员学习Claude官方《构建Skill的完全指南》。

文档版本:综合整理与结构优化版
适用人群:AI产品经理、开发者、企业业务人员、AI工具爱好者
核心建议:理解核心概念(Token/Spec/Agent/MCP)→ 聚焦Skill机制 → 梳理个人/企业工作流 → 动手构建专属Skill → 持续迭代沉淀

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐