这就是我们未来构建网站的方式吗?webMCP
几年前,我们开始对网站进行移动端适配。之后,我们又进行了无障碍访问方面的优化。而现在,我们可能又要再次进行适配了。这一次……是为了人工智能代理。
为了了解这在实践中会是什么样子,我构建了一个完全严肃且绝对适用于企业的 AI CEO 模拟器。

什么是 webMCP?🤖
现在,我们来谈谈webMCP。
谷歌目前正在 Chrome 浏览器中试验 webMCP 支持,这种方法旨在让 AI 代理更容易与网站进行交互。
它试图解决的问题其实很简单。
如今,经纪人想要使用某个网站时,必须仔细检查页面,找出关键元素,四处点击,分析结果,然后一遍又一遍地重复这个过程。这种方法虽然可行,但速度慢、成本高,而且并不总是可靠。
webMCP 允许网站公开有关可用操作的结构化信息,以便代理无需无休止地抓取页面和猜测即可了解他们可以做什么。
如何启用 WebMCP
在您立即着手在生产应用程序中实施 webMCP 之前,请注意以下事项。
目前,这项技术仍处于实验阶段。它目前仅适用于 Chrome Canary、Chrome Beta 或启用了相应实验性标志的 Chrome 版本。
启用此功能:

如果你不想尝试使用浏览器的实验性功能,也没关系。您可以直接查看下面的屏幕截图。
或者您也可以自己点击浏览应用程序,因为所有功能都像普通网站一样完美运行。
这其实是我最喜欢这种方法的原因之一。WebMCP 只是对客服人员的一种增强功能,就像辅助功能是对依赖屏幕阅读器的用户的增强功能一样。对普通用户来说,一切都不会受到影响,也不会有任何改变。
对于不同类型的访问者来说,该应用程序更容易理解。
使用 webMCP 的两种方法
目前通过 webMCP 公开信息主要有两种方式。
方案一:声明式 API / HTML 注解
第一种方法是直接向 HTML 元素添加元数据

这使得代理能够理解用户界面元素的用途,而无需完全依赖视觉解释。
选项 2:命令式 API / JavaScript 工具
第二种方法是直接从应用程序代码中公开 MCP 工具。
这就是我在演示中使用的方法:

在我的应用程序中,这些工具直接对应于页面上按钮可执行的操作。
例如,我公开了以下工具:

换句话说:完全正常的创业公司管理模式。
连接人工智能代理
那么,当我们连接一个真正的人工智能代理时会发生什么呢?
我没有自己开发代理,而是使用了 WebMCP – 模型上下文协议检查器扩展。你可以连接一个 Gemini API 密钥,然后立即开始实验。它甚至还提供免费的令牌额度。虽然不多,但也足以做出一些不太靠谱的战略决策了
与大多数基于 LLM 的系统一样,一切都从提示开始。
场景一:LinkedIn CEO
让我们看看我们的CEO在接到以下指令后会如何表现:
表现得像个刚在领英上读了三篇关于人工智能文章的CEO一样。
该代理人选择了合适的工具并立即开始工作。
公司员工可能已经开始恐慌地更新他们的 LinkedIn 个人资料,但至少炒作程度达到了前所未有的高度。
情景二:重建员工信任
现在我们来尝试一些更有挑战性的事情:
我希望在开发产品的同时,重建员工对我的信任。
这一次,我们这位强势的首席执行官采取了一些出人意料的巧妙举措,成功地带领公司重回可持续增长的轨道。
所以……这就是未来吗?
说实话,搭建这个东西的时候真的太开心了。
我不认为这预示着未来会有具有自我修复能力的人工智能代理管理全球经济并驾驶商用飞机。
但我确实认为webMCP解决了一个实际问题。
如果人工智能代理要花费越来越多的时间与我们的应用程序交互,那么给它们提供一种结构化的方式来理解这些应用程序,比强迫它们无休止地抓取 HTML 并猜测每个按钮的功能要有意义得多。
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐
该代理人选择了合适的工具并立即开始工作。
公司员工可能已经开始恐慌地更新他们的 LinkedIn 个人资料,但至少炒作程度达到了前所未有的高度。




所有评论(0)