Claude Mythos Preview 发布:Anthropic最强 AI 为什么不向公众开放?
一个 AI 模型,在没有任何人类指引的情况下,独自审查了 OpenBSD 两百多万行代码,找到了一个潜藏了27年的漏洞。
这个漏洞可以让攻击者只需要发起一次网络连接,就能让对方机器直接崩溃。
而在上周之前,大多数人甚至不知道这个模型的存在。
4月8日,Anthropic 同时发布了两件事:一个叫 Claude Mythos Preview 的前沿模型,和一个叫 Project Glasswing(玻璃翅计划) 的行业联合倡议。
说是两件事,本质是一件事的两面——一把剑足够锋利,所以你必须先想清楚它被谁拿着。

这把剑有多锋利
先看几个数字。
在网络安全漏洞复现基准 CyberGym 上,Mythos Preview 得了83.1%;而 Anthropic 目前公开的最强模型 Claude Opus 4.6 只有66.6%。16个百分点的差距在这个领域意味着什么?意味着能找到的漏洞类型,根本不在同一个层面。
代码工程能力上同样差异显著:
|
基准测试 |
Mythos Preview |
Opus 4.6 |
|---|---|---|
|
SWE-bench Verified |
93.9% |
80.8% |
|
SWE-bench Pro |
77.8% |
53.4% |
|
Terminal-Bench 2.0 |
82.0% |
65.4% |
|
GPQA Diamond(硬科学推理) |
94.6% |
91.3% |
|
Humanity's Last Exam(有工具) |
64.7% |
53.1% |
但这些数字是抽象的。以下三个具体案例,才是真正让人坐不住的部分。
案例一:OpenBSD,27年前埋下的炸弹
OpenBSD 是以"安全"著称的操作系统,专门用来跑防火墙、路由器等关键基础设施,每一行代码都经过严格审计,"默认安全"是它的设计哲学。
Mythos Preview 在里面找到了一个1998年就存在的漏洞。
攻击者不需要登录,不需要任何权限,只需发起一次网络连接,就能让任何运行 OpenBSD 的机器远程崩溃。27年,经历了无数次人工审计和自动化扫描,没有人发现,AI 发现了。
案例二:FFmpeg,500万次自动化测试都没找到
FFmpeg 是处理音视频编解码的底层库,几乎所有主流应用和系统都依赖它。
Mythos Preview 在一行代码里发现了一个藏了16年的安全缺陷。
这行代码已经被自动化测试工具命中了五百万次——一次都没有触发这个漏洞。AI 找到了。
案例三:Linux 内核,从普通用户到全机控制
更令人不安的是这个:Mythos Preview 自主发现了 Linux 内核中的多个漏洞,然后把它们串联成一条完整的提权攻击链——从普通用户权限,到完全控制整台机器。
全程没有人类指引,模型自己想出来的。
以上所有漏洞均已报告给相关软件维护方,目前已完成修补。

双刃剑的困境
读到这里,你大概感受到了那种让人不舒服的张力。
这些能力是用来做防御的。但同样这些能力,如果落入攻击者手里呢?
Cisco 首席安全官 Anthony Grieco 说得很直白:
"AI 能力已经跨越了一个临界点,从根本上改变了保护关键基础设施的紧迫程度,而且没有回头路了。旧的加固系统的方式不再够用。"
这不是在夸 Anthropic,这是在说一件让人坐立不安的事实:AI 驱动的漏洞挖掘,已经不是未来,是现在。
Anthropic 自己也承认,Mythos Preview 所代表的进攻性能力,很快就会扩散到更多人手里——包括那些不承诺负责任部署的人。当前全球每年的网络犯罪损失估计在5000亿美元左右,这个数字,在 AI 加持之后,只会更难看。
玻璃翅计划:先把剑交给防御者
玻璃翅蝴蝶(Greta oto)的翅膀是透明的,让它能藏在叶片之间,难以被发现——就像漏洞藏在代码里一样。但透明翅膀同时也是一种坦诚,让一切无所遁形。这就是这个项目名字的双重隐喻。
Anthropic 的思路是:在攻击者之前,先把这把剑交给防御者。
Project Glasswing 的联盟阵容相当豪华:
AWS、Apple、Broadcom、Cisco、CrowdStrike、Google、JPMorganChase、Linux Foundation、Microsoft、NVIDIA、Palo Alto Networks
以及另外40余家关键开源基础设施维护组织。

这些机构会用 Mythos Preview 扫描和修复各自负责的关键系统——而它们合在一起,覆盖了全球极大比例的软件攻击面。
Anthropic 同时承诺:
-
提供1亿美元模型使用积分,专门用于这批防御性安全工作
-
向 Alpha-Omega、OpenSSF(通过 Linux Foundation)和 Apache 软件基金会合计捐款400万美元
-
90天内公开汇报修复了哪些漏洞、学到了什么
最强 AI 为什么不向公众开放?
这里有一个细节值得注意:Anthropic 明确说,Mythos Preview 不会向普通用户公开发布。
这不是谦虚,是一个认真的安全判断——他们认为这个模型的进攻性能力太强,在没有完善防护措施的前提下,不能让任何人都能调用。
他们的路线图是:先通过即将发布的 Claude Opus 新版本打磨、验证新的网络安全防护措施;等这些措施足够成熟,再逐步开放 Mythos 级别的能力。
这个逻辑值得细想一下:做到某件事的能力,不等于负责任地部署的能力。
对于确实有合法需求的安全研究人员,Mythos Preview 后续会在 Claude API、Amazon Bedrock、Google Vertex AI、Microsoft Foundry 上提供,定价 125 每百万 token。

最后说几句话
看完这份公告,我有一种很复杂的感觉。
一方面,这确实是能力跃迁。从"AI辅助安全研究"到"AI自主发现27年未修复零日漏洞",中间不只是量的积累,更像是质的变化。"AI 会不会替代安全研究员"这个问题,现在开始有了清晰的答案——至少在漏洞挖掘这件事上,前沿 AI 的水平已经触及人类顶尖专家的边界。
另一方面,Anthropic 描述的这个未来让人有些不安:攻击和防御用的是同一套能力,竞赛的关键不再是谁更聪明,而是谁先用上这个能力。Project Glasswing 本质上是一场赛跑——先把最好的工具给到防御者手里,在攻击者也拥有同等能力之前,把漏洞修掉。
这个逻辑说得通。但它也意味着一件事:这条赛道已经开跑了,而且不会有终点。
CrowdStrike CTO Elia Zaitsev 有一句话说到了核心:
"漏洞被发现到被利用之间的时间窗口已经关闭了——以前需要几个月的事情,现在 AI 几分钟就能搞定。这不是放慢脚步的理由,而是一起更快行动的理由。"
如果你是开发者,这件事最直接的启发可能是:你写的代码,以后面对的不只是人工审计和传统扫描工具,还有能自主发现并利用漏洞的 AI。
这不是坏消息,这是一个信号——你的代码,该认真对待安全这件事了。
我是顾北,关注我,我们下期再见!
参考文章:
https://www-cdn.anthropic.com/8b8380204f74670be75e81c820ca8dda846ab289.pdf
https://www.anthropic.com/glasswing
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐
所有评论(0)