从提示词到智能体:Agent Skills、MCP 与 Prompt 的实战演进之路
摘要:当 AI 从"问答工具"进化为"自主代理",开发者需要掌握哪些新范式?本文深度解析 Agent Skills、MCP(Model Context Protocol)与 Prompt Engineering 的核心差异、适用场景与实战案例,带你构建真正能干活儿的智能体。
2024 年,很多开发者还在用这样的方式调用大模型:
response = client.chat.completions.create( model="gpt-4", messages=[{"role": "user", "content": "帮我写个 Python 脚本"}])
问题在于:每次对话都是"失忆"的。模型不知道你的项目结构、没有文件访问权限、无法执行代码。用户不得不反复粘贴上下文,AI 输出的代码可能根本跑不起来。
这就是传统 Prompt 模式的天花板——它把 AI 当成一个"聪明的实习生",每次布置任务都要重新介绍背景。
而 Agent(智能体)范式 的核心突破在于:让 AI 拥有"手脚"和"记忆"。
二、三种范式的本质区别
2.1 Prompt Engineering:对话的艺术
定义:通过精心设计的提示词,引导模型输出符合预期的内容。
核心能力:
- • 角色扮演(“你是一位资深 Python 工程师”)
- • 思维链(“请逐步推理”)
- • 示例学习(Few-shot Learning)
适用场景:
| 场景 | 典型案例 |
|---|---|
| 内容生成 | 写文章、翻译、润色 |
| 知识问答 | 解释概念、总结文档 |
| 创意辅助 | 头脑风暴、起名、写诗 |
| 单次任务 | 代码片段生成、SQL 查询 |
局限:
- • ❌ 无法访问外部系统(文件、数据库、API)
- • ❌ 没有持久记忆(每次对话从零开始)
- • ❌ 无法执行动作(只能"说",不能"做")
案例:用 Prompt 让 AI 写一个爬虫
你是一位 Python 专家。请写一个爬取知乎热榜的脚本,要求:1) 使用 requests 库 2) 解析 HTML 3) 保存为 CSV
输出:一段代码。但可能缺少异常处理、没有考虑反爬、无法直接运行。
2.2 Agent Skills:给 AI 装上"工具箱"
定义:为智能体预定义可执行的功能模块,AI 可以自主决定何时调用哪个技能。
核心突破:
- • ✅ 工具调用:AI 可以执行搜索、读写文件、调用 API
- • ✅ 状态保持:会话期间记住上下文和中间结果
- • ✅ 自主决策:根据任务拆解,选择调用哪些技能
OpenClaw Agent Skills 架构:
┌─────────────────────────────────────────┐│ 用户消息 ││ "帮我分析这个项目的代码结构" │└─────────────────┬───────────────────────┘ │┌─────────────────▼───────────────────────┐│ Agent 路由层 ││ - 理解意图 ││ - 规划任务步骤 ││ - 选择技能 │└─────────────────┬───────────────────────┘ │ ┌─────────────┼─────────────┐ │ │ │┌───▼───┐ ┌────▼────┐ ┌───▼───┐│文件读取│ │代码分析 │ │ 生成 ││ 技能 │ │ 技能 │ │ 报告 │└───┬───┘ └────┬────┘ └───┬───┘ │ │ │ └─────────────┼─────────────┘ │┌─────────────────▼───────────────────────┐│ 最终响应 ││ "项目共 128 个文件,核心模块在 src/..." │└─────────────────────────────────────────┘
适用场景:
| 场景 | 典型案例 |
|---|---|
| 开发助手 | 代码审查、Bug 定位、重构建议 |
| 数据分析 | 读取 CSV、生成图表、统计洞察 |
| 自动化运维 | 日志分析、健康检查、告警响应 |
| 内容运营 | 多平台发布、SEO 优化、配图生成 |
实战案例:OpenClaw 的 feishu-bitable 技能
用户说:“把上周的会议纪要整理成多维表格”
Agent 自主执行:
- 调用
feishu_im_user_search_messages搜索上周消息 - 调用
feishu_bitable_app_table_record创建表格记录 - 调用
feishu_task_task为每个待办创建任务
关键代码结构(SKILL.md 定义):
## feishu-bitable**当以下情况时使用此 Skill**:(1) 需要创建或管理飞书多维表格 App(2) 需要在多维表格中新增、查询、修改、删除记录(3) 需要批量导入数据或批量更新多维表格
Agent 根据这个描述,自主判断何时调用该技能,无需用户显式指定。
2.3 MCP(Model Context Protocol):AI 的"通用接口"
定义:Anthropic 提出的开放协议,标准化 AI 与外部数据源/工具的连接方式。
为什么需要 MCP?
在 MCP 之前,每个 AI 应用都要自己实现:
- • 文件读取 → 自己写文件系统 API
- • 数据库查询 → 自己实现 SQL 连接
- • Git 操作 → 自己封装 Git 命令
MCP 的统一抽象:
┌──────────────┐ MCP Protocol ┌──────────────┐│ AI 模型 │ ◄──────────────────► │ MCP Server ││ (Claude 等) │ │ (文件系统) │└──────────────┘ └──────────────┘ │ ▼ ┌──────────────┐ │ 实际资源 │ │ (磁盘文件) │ └──────────────┘
MCP 的三种资源类型:
-
Prompts:预定义的提示词模板```plaintext
{ “name”: “code-review”, “arguments”: [“file_path”, “language”], “template”: “请审查 {file_path} 的 {language} 代码…”} -
Resources:可读的数据源```plaintext
{ “uri”: “file:///project/src/main.py”, “mimeType”: “text/x-python”, “description”: “项目主入口文件”} -
Tools:可执行的操作```plaintext
{ “name”: “execute_command”, “inputSchema”: {“command”: {“type”: “string”}}, “description”: “在终端执行命令”}
适用场景:
| 场景 | 典型案例 |
|---|---|
| IDE 集成 | Cursor、Windsurf 的代码上下文 |
| 企业知识库 | 连接内部文档、数据库、Wiki |
| 跨应用协作 | 让 AI 同时操作 Slack、Jira、GitHub |
| 私有化部署 | 本地文件、内网 API、离线模型 |
实战案例:用 MCP 连接本地数据库
// mcp-config.json{ "servers": { "postgres": { "command": "npx", "args": ["-y", "@modelcontextprotocol/server-postgres"], "env": { "DATABASE_URL": "postgresql://user:pass@localhost:5432/mydb" } } }}
AI 可以自然地说:“查询上个月订单总额”,MCP Server 自动转换为 SQL 并返回结果。
三、三种技术的选型决策树
┌─────────────────┐ │ 用户需求是什么? │ └────────┬────────┘ │ ┌──────────────┼──────────────┐ │ │ │ ▼ ▼ ▼ ┌──────────┐ ┌──────────┐ ┌──────────┐ │ 只需生成 │ │ 需要执行 │ │ 需要连接 │ │ 文本内容 │ │ 具体动作 │ │ 外部系统 │ └────┬─────┘ └────┬─────┘ └────┬─────┘ │ │ │ ▼ ▼ ▼ ┌──────────┐ ┌──────────┐ ┌──────────┐ │ Prompt │ │ Agent │ │ MCP │ │ │ │ Skills │ │ │ └──────────┘ └──────────┘ └──────────┘
快速决策表:
| 需求特征 | 推荐方案 | 理由 |
|---|---|---|
| 单次内容生成 | Prompt | 简单直接,无需额外配置 |
| 多步骤任务 | Agent Skills | 可拆解、可追踪、可回滚 |
| 访问本地文件 | MCP | 标准化接口,安全可控 |
| 跨平台自动化 | Agent Skills | 内置多平台技能(微信、飞书等) |
| 企业私有部署 | MCP + Agent | MCP 连接内网,Agent 处理逻辑 |
| 快速原型验证 | Prompt | 几分钟即可测试想法 |
四、综合实战:构建一个"技术博主助手"
场景描述
你是一位技术博主,需要:
- 监控 GitHub Trending 获取灵感
- 搜索最新技术文档
- 生成文章草稿
- 配图并发布到微信公众号
方案对比
纯 Prompt 方案:
你是一个技术博主。请根据今天的 GitHub Trending 写一篇关于 Rust 异步编程的文章,要求 3000 字,包含代码示例。然后帮我生成一个封面图,最后发布到微信公众号。
结果:AI 会告诉你它做不到——无法访问实时数据、无法调用 API、无法发布。
Agent Skills 方案(基于 OpenClaw):
任务:技术文章全流程自动化技能组合: - web_search: 搜索 GitHub Trending - web_fetch: 抓取技术文档 - baoyu-image-gen: 生成封面图 - baoyu-post-to-wechat: 发布到公众号执行流程: 1. 搜索 "GitHub Trending Rust" 2. 抓取 top3 项目的 README 3. 分析技术亮点,生成大纲 4. 撰写正文(3000 字) 5. 生成封面图(Rust 主题) 6. 调用微信 API 发布
实际执行日志:
[Agent] 收到任务:写一篇 Rust 异步编程文章[Agent] 规划步骤:搜索 → 抓取 → 分析 → 写作 → 配图 → 发布[Step 1] 调用 web_search Query: "GitHub Trending Rust async" 结果:tokio、async-std、embassy 进入趋势榜[Step 2] 调用 web_fetch URL: https://github.com/tokio-rs/tokio 提取:README 中的核心特性、使用示例[Step 3] 撰写文章 标题:《2026 Rust 异步编程:tokio 1.40 新特性深度解析》 字数:3247 字 结构:引言 → 核心概念 → 实战案例 → 性能对比 → 总结[Step 4] 调用 baoyu-image-gen Prompt: "Rust 编程语言封面图,螃蟹 logo,赛博朋克风格" 输出:cover-20260317.png[Step 5] 调用 baoyu-post-to-wechat 状态:发布成功 链接:https://mp.weixin.qq.com/s/xxxxx
代码实现(OpenClaw 配置)
// ~/.openclaw/config.json{ "agents": { "tech-writer": { "skills": [ "web_search", "web_fetch", "baoyu-image-gen", "baoyu-post-to-wechat" ], "model": "qwen3.5-plus", "workspace": "~/blog-drafts" } }, "channels": { "wechat": { "apiToken": "your-wechat-api-token", "autoPublish": false // 发布前需人工确认 } }}
触发方式(微信消息):
你:写一篇关于 Rust 异步编程的文章Agent: 收到!正在搜索最新资料... (3 分钟后)Agent: 文章已完成,共 3247 字,封面图已生成。 是否现在发布到公众号?[确认] [取消]
五、避坑指南:常见误区与解决方案
误区 1:过度依赖 Prompt,忽视工具建设
症状:
- • 每次都要在 Prompt 里粘贴大量上下文
- • AI 经常"幻觉"出不存在的 API
- • 复杂任务需要反复纠正
解决:将高频操作封装为 Agent Skills
// 错误做法Prompt: "请读取 /project/src/main.py 文件,分析代码结构..."// 正确做法Skill: file-read 描述:读取指定路径的文件内容 参数:path (string) Agent 自主调用:file-read("/project/src/main.py")
误区 2:技能粒度过细,Agent 调度开销大
症状:
- • 一个简单任务调用几十次技能
- • 响应速度慢(>30 秒)
- • Token 消耗巨大
解决:合并高频技能,增加批量操作
// 过细的技能- feishu-bitable-create-app- feishu-bitable-create-table- feishu-bitable-create-field- feishu-bitable-create-record// 推荐的粒度- feishu-bitable(支持批量创建表、字段、记录)
误区 3:MCP 配置复杂,忽视安全边界
症状:
- • MCP Server 暴露了不该访问的文件
- • AI 可以执行任意系统命令
- • 生产环境出现数据泄露
解决:最小权限原则 + 审计日志
// mcp-config.json{ "servers": { "filesystem": { "command": "npx", "args": ["-y", "@modelcontextprotocol/server-filesystem"], "env": { "ALLOWED_PATHS": "/project,/docs" // 限制访问范围 } } }}
六、未来展望:Agent 的下一个演进方向
6.1 多 Agent 协作
单个 Agent 能力有限,但多个 Agent 可以分工:
┌─────────────┐│ 用户请求 │└──────┬──────┘ │┌──────▼──────┐│ Planner │ ← 任务拆解└──────┬──────┘ │ ┌────┴────┬──────────┐ │ │ │┌─▼─┐ ┌──▼──┐ ┌──▼──┐│研究│ │ 写作 │ │ 审核 ││Agent│ │Agent│ │Agent│└───┘ └─────┘ └─────┘
OpenClaw 已支持多 Agent 路由,可为不同任务分配不同 Agent。
6.2 长期记忆与个性化
当前 Agent 的记忆局限于单次会话。未来方向:
- • 向量数据库:存储历史对话、用户偏好
- • 个性化技能:根据用户习惯自动调整
- • 跨会话学习:从错误中持续改进
6.3 端侧 Agent
随着模型小型化,Agent 将运行在本地设备:
- • 手机上的个人助理(访问相册、日历、位置)
- • 浏览器扩展(自动填写表单、比价、总结网页)
- • IDE 插件(实时代码审查、自动重构)
七、总结
| 维度 | Prompt | Agent Skills | MCP |
|---|---|---|---|
| 核心能力 | 引导输出 | 执行动作 | 连接资源 |
| 学习成本 | 低 | 中 | 高 |
| 灵活性 | 高 | 中 | 中 |
| 可扩展性 | 低 | 高 | 高 |
| 适用阶段 | 原型验证 | 生产应用 | 企业集成 |
最佳实践:
- 从 Prompt 开始:快速验证想法
- 用 Agent Skills 固化:将高频操作封装为技能
- 用 MCP 扩展边界:连接私有数据和内部系统
- 保持人工审核:关键操作(发布、删除、支付)需确认
学AI大模型的正确顺序,千万不要搞错了
🤔2026年AI风口已来!各行各业的AI渗透肉眼可见,超多公司要么转型做AI相关产品,要么高薪挖AI技术人才,机遇直接摆在眼前!
有往AI方向发展,或者本身有后端编程基础的朋友,直接冲AI大模型应用开发转岗超合适!
就算暂时不打算转岗,了解大模型、RAG、Prompt、Agent这些热门概念,能上手做简单项目,也绝对是求职加分王🔋

📝给大家整理了超全最新的AI大模型应用开发学习清单和资料,手把手帮你快速入门!👇👇
学习路线:
✅大模型基础认知—大模型核心原理、发展历程、主流模型(GPT、文心一言等)特点解析
✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑
✅开发基础能力—Python进阶、API接口调用、大模型开发框架(LangChain等)实操
✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用
✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代
✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经
以上6大模块,看似清晰好上手,实则每个部分都有扎实的核心内容需要吃透!
我把大模型的学习全流程已经整理📚好了!抓住AI时代风口,轻松解锁职业新可能,希望大家都能把握机遇,实现薪资/职业跃迁~
这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐



所有评论(0)