【Agent 开发】讲讲 Agent 通信协议：MCP、A2A 和 ANP 到底在解决什么问题？

m0_72351119

478人浏览 · 2026-05-15 16:24:45

m0_72351119 · 2026-05-15 16:24:45 发布

文章目录

前言
写在文后

🔥 个人主页：铁皮哥（欢迎关注）
📌 作者简介：28届校招生，后端开发/Agent 方向在学
📚 学习内容：Java、Python、计算机视觉、大语言模型、Agent开发
📝 专栏内容：从零开始的Claude Code零代码生活（持续更新中）
✨不只背八股，更想搞懂为什么这样设计

前言

提到 Agent，我们很容易想到 ReAct、Tool Calling、多轮规划 这些能力。

它看起来像是一个会思考、会行动的智能助手，能理解任务，能调用工具，也能根据结果继续推理。

但当 Agent 真正进入复杂场景后，问题就不再只是：

模型能不能想明白？

而是变成了：

想明白之后，能不能稳定地连接外部世界？

因为 Agent 不可能永远单打独斗。
它需要访问外部工具、读取数据资源，也可能需要和其他 Agent 协作完成任务。

这时候，通信协议 的价值就出现了。

这篇文章就简单聊聊三个常见概念：

协议	关注点
MCP	Agent 如何连接工具和资源
A2A	Agent 之间如何协作
ANP	大量 Agent 如何被发现和连接

一、为什么 Agent 需要通信协议

1.1 从单个 Agent 到复杂系统

一个最简单的 Agent，可以只连接一两个工具。

比如给它一个搜索工具，它就可以查资料；给它一个文件读取工具，它就可以总结文档；给它一个代码执行环境，它就可以帮我们验证一段程序。

在这种情况下，开发者知道 Agent 能调用哪些工具，也知道每个工具需要什么参数、会返回什么结果。整个流程虽然不一定优雅，但至少可控。

可是当 Agent 要处理的任务越来越复杂，它面对的外部环境就不再这么简单了。

比如一个“论文调研 Agent”，可能需要先联网搜索相关论文，再读取本地 PDF，接着从笔记软件里找历史记录，还可能调用代码环境复现实验结果，最后再把内容整理成一份报告。

这时候，它是在和一组工具、一批数据源、多个服务进行交互。

再往前一步，如果这个任务不是一个 Agent 独立完成，而是交给多个 Agent 分工处理，情况会更复杂。一个 Agent 负责资料检索，一个 Agent 负责代码分析，一个 Agent 负责内容总结，另一个 Agent 负责最终排版。它们之间需要传递上下文、同步任务状态、交换中间结果。

到了这个阶段，Agent 系统关注的问题就发生了变化。

最开始我们关心的是：

这个 Agent 能不能完成任务？

后来我们更关心的是：

这些 Agent 和工具能不能稳定、标准、可扩展地协作？

前者更多是模型能力问题，后者则是系统连接问题。

而通信协议要解决的，正是后面这个问题。

1.2 如果没有协议，会发生什么

可以想象一个没有统一协议的 Agent 系统。

开发者想让 Agent 访问本地文件，就写一套文件读取工具；想让它查询数据库，就再写一套数据库工具；想让它调用 GitHub，就继续封装 GitHub API；想让它访问浏览器、搜索引擎、内部系统，就不断增加新的适配逻辑。

一开始这看起来没什么问题，甚至很直接。

但随着工具越来越多，问题会迅速堆起来。

不同工具的参数格式不一样，返回结果不一样，错误信息不一样，权限控制方式也不一样。Agent 想要理解这些工具，就需要依赖开发者提前写好的描述和适配逻辑。工具一多，这些描述、参数、返回值和异常处理就会变得越来越难维护。

更麻烦的是，不同平台之间还可能互不兼容。

在一个框架里写好的工具，换到另一个 Agent 平台里可能不能直接用；一个服务已经封装过一次，接入另一个客户端时又要重新封装；一个 Agent 想把任务交给另一个 Agent，也需要重新约定消息格式和交互流程。

最后，系统会慢慢变成一堆胶水代码。

表面上看，Agent 的能力越来越多；但实际上，每增加一个能力，系统复杂度也在增加。开发者要花大量精力处理工具适配、格式转换、错误兜底和上下文传递，而不是专注于任务本身。

这也是为什么 Agent 系统发展到一定阶段后，通信协议会变得重要。

协议的作用，就是把原本分散、临时、各写各的交互方式，变成一套更统一的规则。

它让 Agent 不必关心每个工具背后的具体实现，只需要知道这个工具暴露了什么能力、需要什么参数、会返回什么结果。它也让不同 Agent 之间可以按照统一格式传递任务和结果，而不是每次协作都重新设计一套消息结构。

当系统还很小时，协议看起来可能有点“多余”；但当工具、资源、Agent 数量不断增加时，没有协议才是真正难以维护的地方。

1.3 Agent 通信协议到底“协议”在哪

所谓通信协议，并不是一个很玄的概念。

它本质上是在约定：两个系统之间应该如何理解彼此。

就像 HTTP 约定了浏览器和服务器之间如何发送请求、返回响应；数据库协议约定了客户端如何连接数据库、提交查询、接收结果；RPC 框架约定了服务之间如何调用方法、传递参数、处理异常。

Agent 通信协议也是类似的思路。

只不过在 Agent 场景下，通信对象变得更加丰富。它可能是 Agent 和工具之间的通信，也可能是 Agent 和数据资源之间的通信，还可能是 Agent 和 Agent 之间的通信。

因此，一个 Agent 通信协议通常需要回答几个问题。

首先是：对方是谁？

Agent 需要知道自己正在连接的是一个工具、一个资源服务，还是另一个 Agent。不同对象的交互方式不同，能提供的能力也不同。

其次是：对方能做什么？

一个工具可能能读取文件，一个服务可能能查询数据库，一个 Agent 可能擅长代码分析或资料总结。协议需要提供一种能力描述方式，让 Agent 能够理解对方暴露了哪些能力。

然后是：应该如何发起请求？

当 Agent 决定调用某个能力时，需要知道请求格式是什么，参数应该怎么传，哪些字段是必需的，哪些字段是可选的。

接下来是：结果如何返回？

调用完成后，对方需要用一种稳定的格式返回结果。成功时返回什么，失败时返回什么，任务进行中又该如何表示，这些都需要约定。

最后还有一个很现实的问题：权限和安全如何处理？

Agent 能连接外部工具，就意味着它可能访问文件、数据库、网页、代码仓库，甚至业务系统。如果没有权限边界，Agent 的能力越强，风险也越大。所以通信协议不仅要考虑“怎么连上”，还要考虑“哪些能力可以被谁调用”。

它的目标也不是让所有 Agent 都变成同一种形态，而是让不同工具、不同服务、不同 Agent 之间，有机会用一种更标准的方式互相理解。

二、MCP、A2A、ANP 分别在解决什么问题

2.1 MCP：让 Agent 更方便地连接工具和资源

MCP，全称是 Model Context Protocol。

它强调的是 Model 和 Context 之间的连接。这里的 Context 不只是聊天上下文，也可以理解为模型执行任务时需要接触到的外部信息、工具和资源。

一个 Agent 想要真正完成任务，往往不能只依赖模型内部知识。它可能需要读取本地文件，查询数据库，访问 GitHub 仓库，调用搜索工具，甚至连接公司内部系统。

MCP 的思路，就是把这些外部能力通过统一的协议暴露出来。

它可以把文件系统、数据库、搜索服务、代码仓库等能力封装成一个个 MCP Server。Agent 所在的客户端不需要关心这些能力背后的具体实现，只需要通过 MCP 协议去发现能力、理解参数、发起调用、接收结果。

一个典型的 MCP 结构里，可以理解为三个角色：

角色	可以怎么理解
MCP Host	运行 Agent 的宿主应用，比如桌面客户端、IDE、Agent 平台
MCP Client	Host 内部负责和 MCP Server 通信的组件
MCP Server	暴露工具、资源和能力的一端，比如文件系统、数据库、GitHub 服务