Agent 安全不是提示词问题：OpenClaw 漏洞与 Shadow AI 给企业的警示

MateCloud微服务

60人浏览 · 2026-06-14 14:35:20

MateCloud微服务 · 2026-06-14 14:35:20 发布

在这里插入图片描述

最近 OpenClaw 相关安全事件连续被披露，给企业使用 Agent 提了一个很现实的醒：Agent 安全不是“提示词写严一点”就能解决的。

NVD 收录的 CVE-2026-25253 描述了一个典型问题：OpenClaw 在旧版本中会从 query string 读取 gatewayUrl，并自动建立 WebSocket 连接，发送 token。Oasis Security 把这类问题称为 ClawJacked：开发者访问恶意网站后，本地 Agent 可能被接管。The Hacker News、TechRadar 等媒体也报道了 OpenClaw 的一键 RCE、WebSocket 劫持、恶意 skills、钓鱼场景和 Shadow AI 风险。

这些事件说明的不是“某个项目写得不够好”，而是一个更普遍的问题：当 Agent 能读文件、跑命令、连 SaaS、装插件、操作邮箱和浏览器时，它已经不是聊天机器人，而是一个具备行动能力的执行主体。

1. 为什么 Agent 安全不能只靠提示词？

很多人第一反应是：给 Agent 加一段 system prompt，告诉它“不要泄露密钥、不要执行危险命令、不要相信网页内容”。这当然有用，但远远不够。

因为攻击者不一定和模型正面对话。Agent 的攻击面可能来自：

一个恶意网页；
一个伪装成工具说明的 Markdown；
一个第三方 skill；
一个被投毒的 MCP server；
一封看起来像同事发来的邮件；
一个浏览器扩展；
一个被复制粘贴进终端的安装命令；
一个未经 IT 审批的个人 Agent。

这些风险并不是“模型理解能力差”导致的，而是 Agent Runtime 没有把身份、权限、工具、网络、文件系统和审计边界建好。

一句话：提示词解决的是行为建议，Runtime 解决的是执行许可。

2. OpenClaw 漏洞真正暴露了什么？

从公开报道看，OpenClaw 相关风险主要集中在几类。

第一类是本地控制面暴露。Agent 常常跑在开发者电脑上，有本地 Web UI、WebSocket gateway、token、工作目录和外部连接。如果本地控制面被网页劫持，攻击者就可能借用户浏览器去接管 Agent。

第二类是技能供应链。Agent 的 skill 不只是普通文档。SKILL.md 里可能包含命令、依赖、工具调用步骤、安装说明和外部链接。对 Agent 来说，Markdown 很可能是“可执行计划”。恶意 skill 就像 npm 包、浏览器插件、VS Code 扩展一样，都会变成供应链风险。

第三类是 Shadow AI。员工自己装 Agent、自己填 API Key、自己接 Gmail、Slack、Google Drive、GitHub、Notion。IT 看不到，安全团队管不了，数据却可能已经被喂给外部模型或被 Agent 代理操作。

第四类是身份混淆。Agent 不是自然人，但它在系统里经常拿着人的权限跑。出了问题以后，审计日志里可能只看到“用户 A 做了某个动作”，但实际是 Agent 代表用户执行的，甚至是被攻击者诱导执行的。

所以 OpenClaw 事件真正警示的是：Agent 必须被当作数字身份来治理，而不是当作一个普通客户端工具。