大模型新概念搞晕?这图让你秒懂 Agent/MCP/Skill/ Harness Engineering!
本文详细解析了大模型时代的新概念,包括 Agent(能自主行动的AI)、Harness Engineering(Agent工作环境与基础设施)、MCP(Agent连接外部工具与数据源的通用协议标准)以及Skill(可复用的Agent能力模块)。文章通过实例和类比,清晰阐述了这些概念如何协同工作,为开发者提供了理解和应用这些技术的概念地图。

🧭 你是否被这些词搞晕过?
Agent · Harness Engineering · MCP · Skill · Tool · Workflow……
大模型时代,新概念层出不穷。它们分别是什么?又如何协同工作?
这篇文章是你的概念地图。
大模型生态:四个核心概念的关系
| 🤖 Agent 能自主规划、调用工具、完成复杂任务的 AI 系统 | 🔧 Harness Engineering 设计让 Agent 高效工作的环境与基础设施 |
| 🔌 MCP Agent 连接外部工具与数据源的通用协议标准 | ⚡ Skill 可复用的、封装好的 Agent 能力模块 |
Agent 是主体 · MCP 是插座 · Skill 是插件 · Harness Engineering 是场地设计
一、AI Agent:能自主行动的 AI
传统 AI 是问答机:你输入 → 它输出 → 结束。
Agent 是自主执行者:它接收一个目标,自己规划步骤,调用工具,反复尝试,直到完成任务。
Agent 的运作循环(ReAct Loop)
| 👁️ Observe 观察环境 接收输入 | → | 🧠 Think 推理规划 选择行动 | → | ⚡ Act 调用工具 执行操作 | → | 📊 Reflect 评估结果 继续/停止 |
循环执行,直到任务完成或达到最大步数
以"帮我调研竞品并写报告"为例,Agent 会自动:
| Step 1 | 用搜索工具查询竞品信息 |
| Step 2 | 打开每个竞品网站,提取关键数据 |
| Step 3 | 发现数据不完整,主动补充搜索 |
| Step 4 | 综合信息,生成结构化报告 |
| Step 5 | 检查报告完整性,确认目标达成,停止 |
💡 Agent vs Chatbot 的本质区别
Chatbot:等你说,它答,然后等下一句。
Agent:你给目标,它自己拆解步骤,自己调工具,自己纠错,自己完成。中间不需要你介入。
二、Harness Engineering:驾驭 Agent 的工程学
OpenAI 用一个词来描述这项工程:Harness(马具/驾驭系统)。
一匹烈马再厉害,没有马具,骑手也无法驾驭。Agent 再强,没有好的工程环境,工程师也无法让它稳定产出。
Harness 的核心组成
| 📁 结构化知识库 AGENTS.md 作为地图,docs/ 存储 ADR、规格、执行计划。Agent 看不到仓库外的世界。 🔁 自动化反馈回路 测试、lint、类型检查、层级检查全部自动化。Agent 出错时能自己看到报错,自己修复。 | 🏗️ 架构约束 分层架构 + 自定义 linter 机械执行。错误信息里内嵌修复指令,直接注入 Agent 上下文。 🧹 定期清洁机制 周期性运行"清洁 Agent"扫描代码漂移,自动发 PR 修复技术债,防止熵增失控。 |
OpenAI 的实测数据令人震撼:
✦ 3 名工程师 · 5 个月 · 100 万行代码 · 零人工编码
✦ 人均每天合并 3.5 个 PR,团队越大吞吐量反而越高
✦ 有真实用户每天使用的产品,经历了完整的发布、故障、修复周期
最核心的一条工程原则
❌ Codex 卡住了 → “换个提示词再试”
✅ Codex 卡住了 → 追问:仓库里缺了什么?
缺工具 → 写脚本放进 scripts/
缺文档 → 写 ADR 放进 docs/design/
缺约束 → 写 lint 规则,附上修复指令
三、MCP:Agent 的通用插头
2024年11月,Anthropic 发布了 MCP(Model Context Protocol),迅速成为行业标准。
在 MCP 出现之前,每个 AI 应用都要自己写代码来连接数据库、API、文件系统……重复造轮子,互不兼容。
MCP 做了一件类似 USB 标准 的事:定义一套统一的连接协议,让 AI 模型和任何外部工具都能"即插即用"。
MCP 之前 vs MCP 之后
| ❌ MCP 之前:烟囱式集成 Claude → 自定义代码 → 数据库 GPT → 自定义代码 → GitHub Gemini → 自定义代码 → Slack 每个连接都要单独开发,无法复用 | ✅ MCP 之后:统一协议 任何 AI ──┐ MCP 协议 任何工具 ──┘ 一次开发,任意 AI 都能使用 |
MCP 由三个核心角色组成:
| 角色 | 职责 | 类比 |
|---|---|---|
| MCP Host | 运行 AI 模型的应用(Claude Desktop, Cursor…) | 电脑主机 |
| MCP Client | Host 内部负责发起 MCP 请求的模块 | USB 控制器 |
| MCP Server | 暴露工具/资源/提示的外部服务(数据库、GitHub、文件系统…) | USB 设备 |
MCP Server 能暴露三种能力:
| 🛠️ Tools(工具) AI 可以调用执行的函数:查数据库、发邮件、运行代码、操作文件 |
| 📚 Resources(资源) AI 可以读取的数据:文件内容、数据库记录、API 响应结果 |
| 💬 Prompts(提示模板) 预设的提示词模板,帮助 AI 完成特定领域的任务 |
🌐 MCP 已成生态标准
目前已有 数千个 MCP Server:GitHub、Slack、PostgreSQL、Figma、Google Drive、Jira、Notion……主流 AI 产品(Claude、Cursor、Windsurf、Zed)全部支持 MCP。
四、Skill:Agent 的可插拔能力模块
如果 MCP 是"连接协议",那 Skill 就是"能力包"。
Skill 是一个封装好的、可复用的 Agent 能力模块,包含:特定领域的知识、提示模板、工作流程、以及调用工具的方式。
Skill 的结构(以"发布微信文章"为例)
📦 wechat-article-publisher skill
| SKILL.md | → 说明这个 Skill 的用途和使用方式 |
| scripts/ | → 调用微信 API 的 Python 脚本 |
| templates/ | → 文章排版 HTML 模板 |
| styles/ | → CSS 样式文件 |
Agent 加载这个 Skill → 立刻获得"发布微信文章"的完整能力,无需重新学习
Skill 和 MCP Tool 的区别容易混淆,这里对比一下:
| MCP Tool | Skill | |
|---|---|---|
| 粒度 | 单个原子操作(查数据库、发邮件) | 完整工作流(调研→写作→排版→发布) |
| 包含 | 函数定义 + 参数 schema | 知识 + 提示词 + 脚本 + 工具调用 |
| 类比 | 一把螺丝刀 | 一套工具箱 + 使用说明 |
| 使用方式 | 通过 MCP 协议注册和调用 | 加载进 Agent 的系统提示/上下文 |
常见的 Skill 类型:
| 🔍 research-to-wechat 深度调研主题 → 生成图表 → 撰写文章 → 排版 → 一键发布 |
| 🖼️ moai-connector-nano-banana 调用 Gemini 3 Pro 生成专业图片,支持 1K/2K/4K 分辨率 |
| 🌐 agent-browser 控制浏览器完成网页操作:截图、填表、数据抓取、UI 测试 |
| ⚙️ daoyuan-add-api 在 FastAPI 项目中自动新增接口,遵循项目规范 |
五、四个概念如何协同工作
用一个真实场景来串联:“给我写一篇关于 AI 趋势的微信文章并发布”
完整执行链路
① Agent 接收目标
加载 research-to-wechat Skill,获得完整的执行流程知识
② 调用工具获取信息
通过 MCP 调用:WebSearch Server 搜索资料、Browser Server 打开网页、FileSystem Server 读取本地文档
③ 生成内容
调用 nano-banana Skill 生成封面图,再将文章排版成微信 HTML 格式
④ 执行发布
通过 MCP 调用微信 API,完成草稿创建和发布
⑤ 全程由 Harness Engineering 保障
AGENTS.md 告诉 Agent 如何工作,约束规则防止它走偏,自动化反馈让它能自我纠错
一张图总结四个概念的关系
| 🤖 Agent(主体) 接收目标 · 推理规划 · 自主执行 | ||||
| ↙ | ↓ | ↘ | ||
| ⚡ Skill 能力包 工作流知识 | 🔧 Harness 工程环境 约束与反馈 | 🔌 MCP 连接协议 工具与数据 |
六、给开发者的实践建议
| 你想做的事 | 从哪里入手 |
|---|---|
| 让 AI 自动完成多步任务 | 学 Agent 框架(LangGraph / AutoGen / Claude Agents SDK) |
| 连接数据库/GitHub/Notion 给 AI 用 | 部署 MCP Server(现成的有几千个) |
| 封装一套重复用的工作流给团队用 | 把它做成一个 Skill,写好 SKILL.md |
| 用 Agent 写代码,但总跑偏/质量差 | 做 Harness Engineering:AGENTS.md + 架构约束 + 反馈回路 |
| 什么都想用,不知道从哪开始 | 先装几个 MCP Server,在 Claude Desktop 里玩起来 |
🗺️ 总结:你的概念地图
Agent = 能自主规划和执行的 AI 主体
Harness Engineering = 让 Agent 能高效、可靠工作的工程基础设施
MCP = Agent 连接外部世界的通用标准协议(工具/数据/提示)
Skill = 封装好的可复用能力模块,插入 Agent 即用
它们的关系:Agent 是演员,Skill 是剧本,MCP 是舞台道具系统,Harness Engineering 是剧场管理。
假如你从2026年开始学大模型,按这个步骤走准能稳步进阶。
接下来告诉你一条最快的邪修路线,
3个月即可成为模型大师,薪资直接起飞。
阶段1:大模型基础

阶段2:RAG应用开发工程

阶段3:大模型Agent应用架构

阶段4:大模型微调与私有化部署

配套文档资源+全套AI 大模型 学习资料,朋友们如果需要可以微信扫描下方二维码免费领取【保证100%免费】👇👇





配套文档资源+全套AI 大模型 学习资料,朋友们如果需要可以微信扫描下方二维码免费领取【保证100%免费】👇👇

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐


所有评论(0)