从提示词到智能体：Agent Skills、MCP 与 Prompt 的实战演进之路

Python编程杰哥

519人浏览 · 2026-03-20 17:47:56

Python编程杰哥 · 2026-03-20 17:47:56 发布

摘要：当 AI 从"问答工具"进化为"自主代理"，开发者需要掌握哪些新范式？本文深度解析 Agent Skills、MCP（Model Context Protocol）与 Prompt Engineering 的核心差异、适用场景与实战案例，带你构建真正能干活儿的智能体。

2024 年，很多开发者还在用这样的方式调用大模型：

response = client.chat.completions.create(    model="gpt-4",    messages=[{"role": "user", "content": "帮我写个 Python 脚本"}])

问题在于：每次对话都是"失忆"的。模型不知道你的项目结构、没有文件访问权限、无法执行代码。用户不得不反复粘贴上下文，AI 输出的代码可能根本跑不起来。

这就是传统 Prompt 模式的天花板——它把 AI 当成一个"聪明的实习生"，每次布置任务都要重新介绍背景。

而 Agent（智能体）范式 的核心突破在于：让 AI 拥有"手脚"和"记忆"。

二、三种范式的本质区别

2.1 Prompt Engineering：对话的艺术

定义：通过精心设计的提示词，引导模型输出符合预期的内容。

核心能力：

• 角色扮演（“你是一位资深 Python 工程师”）
• 思维链（“请逐步推理”）
• 示例学习（Few-shot Learning）

适用场景：

场景	典型案例
内容生成	写文章、翻译、润色
知识问答	解释概念、总结文档
创意辅助	头脑风暴、起名、写诗
单次任务	代码片段生成、SQL 查询

局限：

• ❌ 无法访问外部系统（文件、数据库、API）
• ❌ 没有持久记忆（每次对话从零开始）
• ❌ 无法执行动作（只能"说"，不能"做"）

案例：用 Prompt 让 AI 写一个爬虫

你是一位 Python 专家。请写一个爬取知乎热榜的脚本，要求：1) 使用 requests 库 2) 解析 HTML 3) 保存为 CSV

输出：一段代码。但可能缺少异常处理、没有考虑反爬、无法直接运行。

2.2 Agent Skills：给 AI 装上"工具箱"

定义：为智能体预定义可执行的功能模块，AI 可以自主决定何时调用哪个技能。

核心突破：

• ✅ 工具调用：AI 可以执行搜索、读写文件、调用 API
• ✅ 状态保持：会话期间记住上下文和中间结果
• ✅ 自主决策：根据任务拆解，选择调用哪些技能

OpenClaw Agent Skills 架构：

┌─────────────────────────────────────────┐│           用户消息                        ││   "帮我分析这个项目的代码结构"            │└─────────────────┬───────────────────────┘                  │┌─────────────────▼───────────────────────┐│         Agent 路由层                      ││  - 理解意图                              ││  - 规划任务步骤                          ││  - 选择技能                              │└─────────────────┬───────────────────────┘                  │    ┌─────────────┼─────────────┐    │             │             │┌───▼───┐   ┌────▼────┐   ┌───▼───┐│文件读取│   │代码分析 │   │ 生成  ││ 技能   │   │  技能   │   │ 报告  │└───┬───┘   └────┬────┘   └───┬───┘    │             │             │    └─────────────┼─────────────┘                  │┌─────────────────▼───────────────────────┐│           最终响应                        ││  "项目共 128 个文件，核心模块在 src/..."   │└─────────────────────────────────────────┘

适用场景：

场景	典型案例
开发助手	代码审查、Bug 定位、重构建议
数据分析	读取 CSV、生成图表、统计洞察
自动化运维	日志分析、健康检查、告警响应
内容运营	多平台发布、SEO 优化、配图生成

实战案例：OpenClaw 的 feishu-bitable 技能

用户说：“把上周的会议纪要整理成多维表格”

Agent 自主执行：

调用 feishu_im_user_search_messages 搜索上周消息
调用 feishu_bitable_app_table_record 创建表格记录
调用 feishu_task_task 为每个待办创建任务

关键代码结构（SKILL.md 定义）：

## feishu-bitable**当以下情况时使用此 Skill**：(1) 需要创建或管理飞书多维表格 App(2) 需要在多维表格中新增、查询、修改、删除记录(3) 需要批量导入数据或批量更新多维表格

Agent 根据这个描述，自主判断何时调用该技能，无需用户显式指定。

2.3 MCP（Model Context Protocol）：AI 的"通用接口"

定义：Anthropic 提出的开放协议，标准化 AI 与外部数据源/工具的连接方式。

为什么需要 MCP？

在 MCP 之前，每个 AI 应用都要自己实现：

• 文件读取 → 自己写文件系统 API
• 数据库查询 → 自己实现 SQL 连接
• Git 操作 → 自己封装 Git 命令

MCP 的统一抽象：

┌──────────────┐      MCP Protocol      ┌──────────────┐│   AI 模型     │ ◄──────────────────►  │   MCP Server ││  (Claude 等)  │                       │  (文件系统)  │└──────────────┘                       └──────────────┘                                              │                                              ▼                                      ┌──────────────┐                                      │  实际资源    │                                      │ (磁盘文件)   │                                      └──────────────┘

MCP 的三种资源类型：

Prompts：预定义的提示词模板```plaintext
{ “name”: “code-review”, “arguments”: [“file_path”, “language”], “template”: “请审查 {file_path} 的 {language} 代码…”}
Resources：可读的数据源```plaintext
{ “uri”: “file:///project/src/main.py”, “mimeType”: “text/x-python”, “description”: “项目主入口文件”}
Tools：可执行的操作```plaintext
{ “name”: “execute_command”, “inputSchema”: {“command”: {“type”: “string”}}, “description”: “在终端执行命令”}

适用场景：

场景	典型案例
IDE 集成	Cursor、Windsurf 的代码上下文
企业知识库	连接内部文档、数据库、Wiki
跨应用协作	让 AI 同时操作 Slack、Jira、GitHub
私有化部署	本地文件、内网 API、离线模型

实战案例：用 MCP 连接本地数据库

// mcp-config.json{  "servers": {    "postgres": {      "command": "npx",      "args": ["-y", "@modelcontextprotocol/server-postgres"],      "env": {        "DATABASE_URL": "postgresql://user:pass@localhost:5432/mydb"      }    }  }}

AI 可以自然地说：“查询上个月订单总额”，MCP Server 自动转换为 SQL 并返回结果。

三、三种技术的选型决策树

┌─────────────────┐                    │  用户需求是什么？ │                    └────────┬────────┘                             │              ┌──────────────┼──────────────┐              │              │              │              ▼              ▼              ▼       ┌──────────┐   ┌──────────┐   ┌──────────┐       │ 只需生成  │   │ 需要执行  │   │ 需要连接  │       │ 文本内容  │   │ 具体动作  │   │ 外部系统  │       └────┬─────┘   └────┬─────┘   └────┬─────┘            │              │              │            ▼              ▼              ▼       ┌──────────┐   ┌──────────┐   ┌──────────┐       │  Prompt  │   │  Agent   │   │   MCP    │       │          │   │  Skills  │   │          │       └──────────┘   └──────────┘   └──────────┘

快速决策表：

需求特征	推荐方案	理由
单次内容生成	Prompt	简单直接，无需额外配置
多步骤任务	Agent Skills	可拆解、可追踪、可回滚
访问本地文件	MCP	标准化接口，安全可控
跨平台自动化	Agent Skills	内置多平台技能（微信、飞书等）
企业私有部署	MCP + Agent	MCP 连接内网，Agent 处理逻辑
快速原型验证	Prompt	几分钟即可测试想法

四、综合实战：构建一个"技术博主助手"

场景描述

你是一位技术博主，需要：

监控 GitHub Trending 获取灵感
搜索最新技术文档
生成文章草稿
配图并发布到微信公众号

方案对比

纯 Prompt 方案：

你是一个技术博主。请根据今天的 GitHub Trending 写一篇关于 Rust 异步编程的文章，要求 3000 字，包含代码示例。然后帮我生成一个封面图，最后发布到微信公众号。

结果：AI 会告诉你它做不到——无法访问实时数据、无法调用 API、无法发布。

Agent Skills 方案（基于 OpenClaw）：

任务：技术文章全流程自动化技能组合：  - web_search: 搜索 GitHub Trending  - web_fetch: 抓取技术文档  - baoyu-image-gen: 生成封面图  - baoyu-post-to-wechat: 发布到公众号执行流程：  1. 搜索 "GitHub Trending Rust"  2. 抓取 top3 项目的 README  3. 分析技术亮点，生成大纲  4. 撰写正文（3000 字）  5. 生成封面图（Rust 主题）  6. 调用微信 API 发布

实际执行日志：

[Agent] 收到任务：写一篇 Rust 异步编程文章[Agent] 规划步骤：搜索 → 抓取 → 分析 → 写作 → 配图 → 发布[Step 1] 调用 web_search  Query: "GitHub Trending Rust async"  结果：tokio、async-std、embassy 进入趋势榜[Step 2] 调用 web_fetch  URL: https://github.com/tokio-rs/tokio  提取：README 中的核心特性、使用示例[Step 3] 撰写文章  标题：《2026 Rust 异步编程：tokio 1.40 新特性深度解析》  字数：3247 字  结构：引言 → 核心概念 → 实战案例 → 性能对比 → 总结[Step 4] 调用 baoyu-image-gen  Prompt: "Rust 编程语言封面图，螃蟹 logo，赛博朋克风格"  输出：cover-20260317.png[Step 5] 调用 baoyu-post-to-wechat  状态：发布成功  链接：https://mp.weixin.qq.com/s/xxxxx

代码实现（OpenClaw 配置）

// ~/.openclaw/config.json{  "agents": {    "tech-writer": {      "skills": [        "web_search",        "web_fetch",         "baoyu-image-gen",        "baoyu-post-to-wechat"      ],      "model": "qwen3.5-plus",      "workspace": "~/blog-drafts"    }  },  "channels": {    "wechat": {      "apiToken": "your-wechat-api-token",      "autoPublish": false  // 发布前需人工确认    }  }}

触发方式（微信消息）：

你：写一篇关于 Rust 异步编程的文章Agent: 收到！正在搜索最新资料...     （3 分钟后）Agent: 文章已完成，共 3247 字，封面图已生成。       是否现在发布到公众号？[确认] [取消]

五、避坑指南：常见误区与解决方案

误区 1：过度依赖 Prompt，忽视工具建设

症状：

• 每次都要在 Prompt 里粘贴大量上下文
• AI 经常"幻觉"出不存在的 API
• 复杂任务需要反复纠正

解决：将高频操作封装为 Agent Skills

// 错误做法Prompt: "请读取 /project/src/main.py 文件，分析代码结构..."// 正确做法Skill: file-read  描述：读取指定路径的文件内容  参数：path (string)  Agent 自主调用：file-read("/project/src/main.py")

误区 2：技能粒度过细，Agent 调度开销大

症状：

• 一个简单任务调用几十次技能
• 响应速度慢（>30 秒）
• Token 消耗巨大

解决：合并高频技能，增加批量操作

// 过细的技能- feishu-bitable-create-app- feishu-bitable-create-table- feishu-bitable-create-field- feishu-bitable-create-record// 推荐的粒度- feishu-bitable（支持批量创建表、字段、记录）

误区 3：MCP 配置复杂，忽视安全边界

症状：

• MCP Server 暴露了不该访问的文件
• AI 可以执行任意系统命令
• 生产环境出现数据泄露

解决：最小权限原则 + 审计日志

// mcp-config.json{  "servers": {    "filesystem": {      "command": "npx",      "args": ["-y", "@modelcontextprotocol/server-filesystem"],      "env": {        "ALLOWED_PATHS": "/project,/docs"  // 限制访问范围      }    }  }}

六、未来展望：Agent 的下一个演进方向

6.1 多 Agent 协作

单个 Agent 能力有限，但多个 Agent 可以分工：

┌─────────────┐│  用户请求    │└──────┬──────┘       │┌──────▼──────┐│  Planner    │  ← 任务拆解└──────┬──────┘       │  ┌────┴────┬──────────┐  │         │          │┌─▼─┐   ┌──▼──┐   ┌──▼──┐│研究│   │ 写作 │   │ 审核 ││Agent│   │Agent│   │Agent│└───┘   └─────┘   └─────┘

OpenClaw 已支持多 Agent 路由，可为不同任务分配不同 Agent。

6.2 长期记忆与个性化

当前 Agent 的记忆局限于单次会话。未来方向：

• 向量数据库：存储历史对话、用户偏好
• 个性化技能：根据用户习惯自动调整
• 跨会话学习：从错误中持续改进

6.3 端侧 Agent

随着模型小型化，Agent 将运行在本地设备：

• 手机上的个人助理（访问相册、日历、位置）
• 浏览器扩展（自动填写表单、比价、总结网页）
• IDE 插件（实时代码审查、自动重构）

七、总结

维度	Prompt	Agent Skills	MCP
核心能力	引导输出	执行动作	连接资源
学习成本	低	中	高
灵活性	高	中	中
可扩展性	低	高	高
适用阶段	原型验证	生产应用	企业集成

最佳实践：

从 Prompt 开始：快速验证想法
用 Agent Skills 固化：将高频操作封装为技能
用 MCP 扩展边界：连接私有数据和内部系统
保持人工审核：关键操作（发布、删除、支付）需确认

学AI大模型的正确顺序，千万不要搞错了

🤔2026年AI风口已来！各行各业的AI渗透肉眼可见，超多公司要么转型做AI相关产品，要么高薪挖AI技术人才，机遇直接摆在眼前！

有往AI方向发展，或者本身有后端编程基础的朋友，直接冲AI大模型应用开发转岗超合适！

就算暂时不打算转岗，了解大模型、RAG、Prompt、Agent这些热门概念，能上手做简单项目，也绝对是求职加分王🔋

在这里插入图片描述

📝给大家整理了超全最新的AI大模型应用开发学习清单和资料，手把手帮你快速入门！👇👇

学习路线:

✅大模型基础认知—大模型核心原理、发展历程、主流模型（GPT、文心一言等）特点解析
✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑
✅开发基础能力—Python进阶、API接口调用、大模型开发框架（LangChain等）实操
✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用
✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代
✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经

以上6大模块，看似清晰好上手，实则每个部分都有扎实的核心内容需要吃透！

我把大模型的学习全流程已经整理📚好了！抓住AI时代风口，轻松解锁职业新可能，希望大家都能把握机遇，实现薪资/职业跃迁～