大模型新概念搞晕？这图让你秒懂 Agent/MCP/Skill/ Harness Engineering！

Python程序员小泉

688人浏览 · 2026-03-30 17:43:16

Python程序员小泉 · 2026-03-30 17:43:16 发布

本文详细解析了大模型时代的新概念，包括 Agent（能自主行动的AI）、Harness Engineering（Agent工作环境与基础设施）、MCP（Agent连接外部工具与数据源的通用协议标准）以及Skill（可复用的Agent能力模块）。文章通过实例和类比，清晰阐述了这些概念如何协同工作，为开发者提供了理解和应用这些技术的概念地图。

🧭 你是否被这些词搞晕过？

Agent · Harness Engineering · MCP · Skill · Tool · Workflow……
大模型时代，新概念层出不穷。它们分别是什么？又如何协同工作？
这篇文章是你的概念地图。

大模型生态：四个核心概念的关系


🤖 Agent 能自主规划、调用工具、完成复杂任务的 AI 系统	🔧 Harness Engineering 设计让 Agent 高效工作的环境与基础设施
🔌 MCP Agent 连接外部工具与数据源的通用协议标准	⚡ Skill 可复用的、封装好的 Agent 能力模块

Agent 是主体 · MCP 是插座 · Skill 是插件 · Harness Engineering 是场地设计

一、AI Agent：能自主行动的 AI

传统 AI 是问答机：你输入 → 它输出 → 结束。

Agent 是自主执行者：它接收一个目标，自己规划步骤，调用工具，反复尝试，直到完成任务。

Agent 的运作循环（ReAct Loop）


👁️ Observe 观察环境接收输入	→	🧠 Think 推理规划选择行动	→	⚡ Act 调用工具执行操作	→	📊 Reflect 评估结果继续/停止

循环执行，直到任务完成或达到最大步数

以"帮我调研竞品并写报告"为例，Agent 会自动：


Step 1	用搜索工具查询竞品信息
Step 2	打开每个竞品网站，提取关键数据
Step 3	发现数据不完整，主动补充搜索
Step 4	综合信息，生成结构化报告
Step 5	检查报告完整性，确认目标达成，停止

💡 Agent vs Chatbot 的本质区别

Chatbot：等你说，它答，然后等下一句。
Agent：你给目标，它自己拆解步骤，自己调工具，自己纠错，自己完成。中间不需要你介入。

二、Harness Engineering：驾驭 Agent 的工程学

OpenAI 用一个词来描述这项工程：Harness（马具/驾驭系统）。

一匹烈马再厉害，没有马具，骑手也无法驾驭。Agent 再强，没有好的工程环境，工程师也无法让它稳定产出。

Harness 的核心组成


📁 结构化知识库 AGENTS.md 作为地图，docs/ 存储 ADR、规格、执行计划。Agent 看不到仓库外的世界。 🔁 自动化反馈回路测试、lint、类型检查、层级检查全部自动化。Agent 出错时能自己看到报错，自己修复。	🏗️ 架构约束分层架构 + 自定义 linter 机械执行。错误信息里内嵌修复指令，直接注入 Agent 上下文。 🧹 定期清洁机制周期性运行"清洁 Agent"扫描代码漂移，自动发 PR 修复技术债，防止熵增失控。

OpenAI 的实测数据令人震撼：

✦ 3 名工程师 · 5 个月 · 100 万行代码 · 零人工编码
✦ 人均每天合并 3.5 个 PR，团队越大吞吐量反而越高
✦ 有真实用户每天使用的产品，经历了完整的发布、故障、修复周期

最核心的一条工程原则

❌ Codex 卡住了 → “换个提示词再试”

✅ Codex 卡住了 → 追问：仓库里缺了什么？

缺工具 → 写脚本放进 scripts/

缺文档 → 写 ADR 放进 docs/design/

缺约束 → 写 lint 规则，附上修复指令

三、MCP：Agent 的通用插头

2024年11月，Anthropic 发布了 MCP（Model Context Protocol），迅速成为行业标准。

在 MCP 出现之前，每个 AI 应用都要自己写代码来连接数据库、API、文件系统……重复造轮子，互不兼容。

MCP 做了一件类似 USB 标准 的事：定义一套统一的连接协议，让 AI 模型和任何外部工具都能"即插即用"。

MCP 之前 vs MCP 之后


❌ MCP 之前：烟囱式集成 Claude → 自定义代码 → 数据库 GPT → 自定义代码 → GitHub Gemini → 自定义代码 → Slack 每个连接都要单独开发，无法复用		✅ MCP 之后：统一协议任何 AI ──┐ MCP 协议任何工具 ──┘ 一次开发，任意 AI 都能使用

MCP 由三个核心角色组成：

角色	职责	类比
MCP Host	运行 AI 模型的应用（Claude Desktop, Cursor…）	电脑主机
MCP Client	Host 内部负责发起 MCP 请求的模块	USB 控制器
MCP Server	暴露工具/资源/提示的外部服务（数据库、GitHub、文件系统…）	USB 设备

MCP Server 能暴露三种能力：


🛠️ Tools（工具） AI 可以调用执行的函数：查数据库、发邮件、运行代码、操作文件
📚 Resources（资源） AI 可以读取的数据：文件内容、数据库记录、API 响应结果
💬 Prompts（提示模板）预设的提示词模板，帮助 AI 完成特定领域的任务

🌐 MCP 已成生态标准

目前已有 数千个 MCP Server：GitHub、Slack、PostgreSQL、Figma、Google Drive、Jira、Notion……主流 AI 产品（Claude、Cursor、Windsurf、Zed）全部支持 MCP。

四、Skill：Agent 的可插拔能力模块

如果 MCP 是"连接协议"，那 Skill 就是"能力包"。

Skill 是一个封装好的、可复用的 Agent 能力模块，包含：特定领域的知识、提示模板、工作流程、以及调用工具的方式。

Skill 的结构（以"发布微信文章"为例）

📦 wechat-article-publisher skill


SKILL.md	→ 说明这个 Skill 的用途和使用方式
scripts/	→ 调用微信 API 的 Python 脚本
templates/	→ 文章排版 HTML 模板
styles/	→ CSS 样式文件

Agent 加载这个 Skill → 立刻获得"发布微信文章"的完整能力，无需重新学习

Skill 和 MCP Tool 的区别容易混淆，这里对比一下：

	MCP Tool	Skill
粒度	单个原子操作（查数据库、发邮件）	完整工作流（调研→写作→排版→发布）
包含	函数定义 + 参数 schema	知识 + 提示词 + 脚本 + 工具调用
类比	一把螺丝刀	一套工具箱 + 使用说明
使用方式	通过 MCP 协议注册和调用	加载进 Agent 的系统提示/上下文

常见的 Skill 类型：


🔍 research-to-wechat 深度调研主题 → 生成图表 → 撰写文章 → 排版 → 一键发布
🖼️ moai-connector-nano-banana 调用 Gemini 3 Pro 生成专业图片，支持 1K/2K/4K 分辨率
🌐 agent-browser 控制浏览器完成网页操作：截图、填表、数据抓取、UI 测试
⚙️ daoyuan-add-api 在 FastAPI 项目中自动新增接口，遵循项目规范

五、四个概念如何协同工作

用一个真实场景来串联：“给我写一篇关于 AI 趋势的微信文章并发布”

完整执行链路

① Agent 接收目标

加载 research-to-wechat Skill，获得完整的执行流程知识

② 调用工具获取信息

通过 MCP 调用：WebSearch Server 搜索资料、Browser Server 打开网页、FileSystem Server 读取本地文档

③ 生成内容

调用 nano-banana Skill 生成封面图，再将文章排版成微信 HTML 格式

④ 执行发布

通过 MCP 调用微信 API，完成草稿创建和发布

⑤ 全程由 Harness Engineering 保障

AGENTS.md 告诉 Agent 如何工作，约束规则防止它走偏，自动化反馈让它能自我纠错

一张图总结四个概念的关系


🤖 Agent（主体）接收目标 · 推理规划 · 自主执行
↙	↓	↘
⚡ Skill 能力包工作流知识	🔧 Harness 工程环境约束与反馈	🔌 MCP 连接协议工具与数据

六、给开发者的实践建议

你想做的事	从哪里入手
让 AI 自动完成多步任务	学 Agent 框架（LangGraph / AutoGen / Claude Agents SDK）
连接数据库/GitHub/Notion 给 AI 用	部署 MCP Server（现成的有几千个）
封装一套重复用的工作流给团队用	把它做成一个 Skill，写好 SKILL.md
用 Agent 写代码，但总跑偏/质量差	做 Harness Engineering：AGENTS.md + 架构约束 + 反馈回路
什么都想用，不知道从哪开始	先装几个 MCP Server，在 Claude Desktop 里玩起来

🗺️ 总结：你的概念地图

Agent = 能自主规划和执行的 AI 主体
Harness Engineering = 让 Agent 能高效、可靠工作的工程基础设施
MCP = Agent 连接外部世界的通用标准协议（工具/数据/提示）
Skill = 封装好的可复用能力模块，插入 Agent 即用

它们的关系：Agent 是演员，Skill 是剧本，MCP 是舞台道具系统，Harness Engineering 是剧场管理。

假如你从2026年开始学大模型，按这个步骤走准能稳步进阶。

接下来告诉你一条最快的邪修路线，

3个月即可成为模型大师，薪资直接起飞。