一个 AI 模型,在没有任何人类指引的情况下,独自审查了 OpenBSD 两百多万行代码,找到了一个潜藏了27年的漏洞。

这个漏洞可以让攻击者只需要发起一次网络连接,就能让对方机器直接崩溃。

而在上周之前,大多数人甚至不知道这个模型的存在。

4月8日,Anthropic 同时发布了两件事:一个叫 Claude Mythos Preview 的前沿模型,和一个叫 Project Glasswing(玻璃翅计划) 的行业联合倡议。

说是两件事,本质是一件事的两面——一把剑足够锋利,所以你必须先想清楚它被谁拿着

图片

这把剑有多锋利

先看几个数字。

在网络安全漏洞复现基准 CyberGym 上,Mythos Preview 得了83.1%;而 Anthropic 目前公开的最强模型 Claude Opus 4.6 只有66.6%。16个百分点的差距在这个领域意味着什么?意味着能找到的漏洞类型,根本不在同一个层面。

代码工程能力上同样差异显著:

基准测试

Mythos Preview

Opus 4.6

SWE-bench Verified

93.9%

80.8%

SWE-bench Pro

77.8%

53.4%

Terminal-Bench 2.0

82.0%

65.4%

GPQA Diamond(硬科学推理)

94.6%

91.3%

Humanity's Last Exam(有工具)

64.7%

53.1%

但这些数字是抽象的。以下三个具体案例,才是真正让人坐不住的部分。

案例一:OpenBSD,27年前埋下的炸弹

OpenBSD 是以"安全"著称的操作系统,专门用来跑防火墙、路由器等关键基础设施,每一行代码都经过严格审计,"默认安全"是它的设计哲学。

Mythos Preview 在里面找到了一个1998年就存在的漏洞

攻击者不需要登录,不需要任何权限,只需发起一次网络连接,就能让任何运行 OpenBSD 的机器远程崩溃。27年,经历了无数次人工审计和自动化扫描,没有人发现,AI 发现了。

案例二:FFmpeg,500万次自动化测试都没找到

FFmpeg 是处理音视频编解码的底层库,几乎所有主流应用和系统都依赖它。

Mythos Preview 在一行代码里发现了一个藏了16年的安全缺陷。

这行代码已经被自动化测试工具命中了五百万次——一次都没有触发这个漏洞。AI 找到了。

案例三:Linux 内核,从普通用户到全机控制

更令人不安的是这个:Mythos Preview 自主发现了 Linux 内核中的多个漏洞,然后把它们串联成一条完整的提权攻击链——从普通用户权限,到完全控制整台机器。

全程没有人类指引,模型自己想出来的。

以上所有漏洞均已报告给相关软件维护方,目前已完成修补。

图片

双刃剑的困境

读到这里,你大概感受到了那种让人不舒服的张力。

这些能力是用来做防御的。但同样这些能力,如果落入攻击者手里呢?

Cisco 首席安全官 Anthony Grieco 说得很直白:

"AI 能力已经跨越了一个临界点,从根本上改变了保护关键基础设施的紧迫程度,而且没有回头路了。旧的加固系统的方式不再够用。"

这不是在夸 Anthropic,这是在说一件让人坐立不安的事实:AI 驱动的漏洞挖掘,已经不是未来,是现在

Anthropic 自己也承认,Mythos Preview 所代表的进攻性能力,很快就会扩散到更多人手里——包括那些不承诺负责任部署的人。当前全球每年的网络犯罪损失估计在5000亿美元左右,这个数字,在 AI 加持之后,只会更难看。


玻璃翅计划:先把剑交给防御者

玻璃翅蝴蝶(Greta oto)的翅膀是透明的,让它能藏在叶片之间,难以被发现——就像漏洞藏在代码里一样。但透明翅膀同时也是一种坦诚,让一切无所遁形。这就是这个项目名字的双重隐喻。

Anthropic 的思路是:在攻击者之前,先把这把剑交给防御者。

Project Glasswing 的联盟阵容相当豪华:

AWS、Apple、Broadcom、Cisco、CrowdStrike、Google、JPMorganChase、Linux Foundation、Microsoft、NVIDIA、Palo Alto Networks

以及另外40余家关键开源基础设施维护组织。

图片

这些机构会用 Mythos Preview 扫描和修复各自负责的关键系统——而它们合在一起,覆盖了全球极大比例的软件攻击面。

Anthropic 同时承诺:

  • 提供1亿美元模型使用积分,专门用于这批防御性安全工作

  • 向 Alpha-Omega、OpenSSF(通过 Linux Foundation)和 Apache 软件基金会合计捐款400万美元

  • 90天内公开汇报修复了哪些漏洞、学到了什么


最强 AI 为什么不向公众开放?

这里有一个细节值得注意:Anthropic 明确说,Mythos Preview 不会向普通用户公开发布。

这不是谦虚,是一个认真的安全判断——他们认为这个模型的进攻性能力太强,在没有完善防护措施的前提下,不能让任何人都能调用。

他们的路线图是:先通过即将发布的 Claude Opus 新版本打磨、验证新的网络安全防护措施;等这些措施足够成熟,再逐步开放 Mythos 级别的能力。

这个逻辑值得细想一下:做到某件事的能力,不等于负责任地部署的能力。

对于确实有合法需求的安全研究人员,Mythos Preview 后续会在 Claude API、Amazon Bedrock、Google Vertex AI、Microsoft Foundry 上提供,定价 125 每百万 token。

图片


最后说几句话

看完这份公告,我有一种很复杂的感觉。

一方面,这确实是能力跃迁。从"AI辅助安全研究"到"AI自主发现27年未修复零日漏洞",中间不只是量的积累,更像是质的变化。"AI 会不会替代安全研究员"这个问题,现在开始有了清晰的答案——至少在漏洞挖掘这件事上,前沿 AI 的水平已经触及人类顶尖专家的边界。

另一方面,Anthropic 描述的这个未来让人有些不安:攻击和防御用的是同一套能力,竞赛的关键不再是谁更聪明,而是谁先用上这个能力。Project Glasswing 本质上是一场赛跑——先把最好的工具给到防御者手里,在攻击者也拥有同等能力之前,把漏洞修掉。

这个逻辑说得通。但它也意味着一件事:这条赛道已经开跑了,而且不会有终点。

CrowdStrike CTO Elia Zaitsev 有一句话说到了核心:

"漏洞被发现到被利用之间的时间窗口已经关闭了——以前需要几个月的事情,现在 AI 几分钟就能搞定。这不是放慢脚步的理由,而是一起更快行动的理由。"

如果你是开发者,这件事最直接的启发可能是:你写的代码,以后面对的不只是人工审计和传统扫描工具,还有能自主发现并利用漏洞的 AI。

这不是坏消息,这是一个信号——你的代码,该认真对待安全这件事了

我是顾北,关注我,我们下期再见!

参考文章:

https://www-cdn.anthropic.com/8b8380204f74670be75e81c820ca8dda846ab289.pdf

https://www.anthropic.com/glasswing

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐