Claude Mythos Preview 发布：Anthropic最强 AI 为什么不向公众开放？

yfj-unicorn

391人浏览 · 2026-04-08 20:01:23

yfj-unicorn · 2026-04-08 20:01:23 发布

一个 AI 模型，在没有任何人类指引的情况下，独自审查了 OpenBSD 两百多万行代码，找到了一个潜藏了27年的漏洞。

这个漏洞可以让攻击者只需要发起一次网络连接，就能让对方机器直接崩溃。

而在上周之前，大多数人甚至不知道这个模型的存在。

4月8日，Anthropic 同时发布了两件事：一个叫 Claude Mythos Preview 的前沿模型，和一个叫 Project Glasswing（玻璃翅计划） 的行业联合倡议。

说是两件事，本质是一件事的两面——一把剑足够锋利，所以你必须先想清楚它被谁拿着。

这把剑有多锋利

先看几个数字。

在网络安全漏洞复现基准 CyberGym 上，Mythos Preview 得了83.1%；而 Anthropic 目前公开的最强模型 Claude Opus 4.6 只有66.6%。16个百分点的差距在这个领域意味着什么？意味着能找到的漏洞类型，根本不在同一个层面。

代码工程能力上同样差异显著：

基准测试	Mythos Preview	Opus 4.6
SWE-bench Verified	93.9%	80.8%
SWE-bench Pro	77.8%	53.4%
Terminal-Bench 2.0	82.0%	65.4%
GPQA Diamond（硬科学推理）	94.6%	91.3%
Humanity's Last Exam（有工具）	64.7%	53.1%

但这些数字是抽象的。以下三个具体案例，才是真正让人坐不住的部分。

案例一：OpenBSD，27年前埋下的炸弹

OpenBSD 是以"安全"著称的操作系统，专门用来跑防火墙、路由器等关键基础设施，每一行代码都经过严格审计，"默认安全"是它的设计哲学。

Mythos Preview 在里面找到了一个1998年就存在的漏洞。

攻击者不需要登录，不需要任何权限，只需发起一次网络连接，就能让任何运行 OpenBSD 的机器远程崩溃。27年，经历了无数次人工审计和自动化扫描，没有人发现，AI 发现了。

案例二：FFmpeg，500万次自动化测试都没找到

FFmpeg 是处理音视频编解码的底层库，几乎所有主流应用和系统都依赖它。

Mythos Preview 在一行代码里发现了一个藏了16年的安全缺陷。

这行代码已经被自动化测试工具命中了五百万次——一次都没有触发这个漏洞。AI 找到了。

案例三：Linux 内核，从普通用户到全机控制

更令人不安的是这个：Mythos Preview 自主发现了 Linux 内核中的多个漏洞，然后把它们串联成一条完整的提权攻击链——从普通用户权限，到完全控制整台机器。

全程没有人类指引，模型自己想出来的。

以上所有漏洞均已报告给相关软件维护方，目前已完成修补。

双刃剑的困境

读到这里，你大概感受到了那种让人不舒服的张力。

这些能力是用来做防御的。但同样这些能力，如果落入攻击者手里呢？

Cisco 首席安全官 Anthony Grieco 说得很直白：

"AI 能力已经跨越了一个临界点，从根本上改变了保护关键基础设施的紧迫程度，而且没有回头路了。旧的加固系统的方式不再够用。"

这不是在夸 Anthropic，这是在说一件让人坐立不安的事实：AI 驱动的漏洞挖掘，已经不是未来，是现在。

Anthropic 自己也承认，Mythos Preview 所代表的进攻性能力，很快就会扩散到更多人手里——包括那些不承诺负责任部署的人。当前全球每年的网络犯罪损失估计在5000亿美元左右，这个数字，在 AI 加持之后，只会更难看。

玻璃翅计划：先把剑交给防御者

玻璃翅蝴蝶（Greta oto）的翅膀是透明的，让它能藏在叶片之间，难以被发现——就像漏洞藏在代码里一样。但透明翅膀同时也是一种坦诚，让一切无所遁形。这就是这个项目名字的双重隐喻。

Anthropic 的思路是：在攻击者之前，先把这把剑交给防御者。

Project Glasswing 的联盟阵容相当豪华：

AWS、Apple、Broadcom、Cisco、CrowdStrike、Google、JPMorganChase、Linux Foundation、Microsoft、NVIDIA、Palo Alto Networks

以及另外40余家关键开源基础设施维护组织。

这些机构会用 Mythos Preview 扫描和修复各自负责的关键系统——而它们合在一起，覆盖了全球极大比例的软件攻击面。

Anthropic 同时承诺：

提供1亿美元模型使用积分，专门用于这批防御性安全工作
向 Alpha-Omega、OpenSSF（通过 Linux Foundation）和 Apache 软件基金会合计捐款400万美元
90天内公开汇报修复了哪些漏洞、学到了什么

最强 AI 为什么不向公众开放？

这里有一个细节值得注意：Anthropic 明确说，Mythos Preview 不会向普通用户公开发布。

这不是谦虚，是一个认真的安全判断——他们认为这个模型的进攻性能力太强，在没有完善防护措施的前提下，不能让任何人都能调用。

他们的路线图是：先通过即将发布的 Claude Opus 新版本打磨、验证新的网络安全防护措施；等这些措施足够成熟，再逐步开放 Mythos 级别的能力。

这个逻辑值得细想一下：做到某件事的能力，不等于负责任地部署的能力。

对于确实有合法需求的安全研究人员，Mythos Preview 后续会在 Claude API、Amazon Bedrock、Google Vertex AI、Microsoft Foundry 上提供，定价 125 每百万 token。

最后说几句话

看完这份公告，我有一种很复杂的感觉。

一方面，这确实是能力跃迁。从"AI辅助安全研究"到"AI自主发现27年未修复零日漏洞"，中间不只是量的积累，更像是质的变化。"AI 会不会替代安全研究员"这个问题，现在开始有了清晰的答案——至少在漏洞挖掘这件事上，前沿 AI 的水平已经触及人类顶尖专家的边界。

另一方面，Anthropic 描述的这个未来让人有些不安：攻击和防御用的是同一套能力，竞赛的关键不再是谁更聪明，而是谁先用上这个能力。Project Glasswing 本质上是一场赛跑——先把最好的工具给到防御者手里，在攻击者也拥有同等能力之前，把漏洞修掉。

这个逻辑说得通。但它也意味着一件事：这条赛道已经开跑了，而且不会有终点。

CrowdStrike CTO Elia Zaitsev 有一句话说到了核心：

"漏洞被发现到被利用之间的时间窗口已经关闭了——以前需要几个月的事情，现在 AI 几分钟就能搞定。这不是放慢脚步的理由，而是一起更快行动的理由。"

如果你是开发者，这件事最直接的启发可能是：你写的代码，以后面对的不只是人工审计和传统扫描工具，还有能自主发现并利用漏洞的 AI。

这不是坏消息，这是一个信号——你的代码，该认真对待安全这件事了。

我是顾北，关注我，我们下期再见！

参考文章：

https://www-cdn.anthropic.com/8b8380204f74670be75e81c820ca8dda846ab289.pdf

https://www.anthropic.com/glasswing

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

蒙特卡洛风光场景并通过削减法聚类法得到几个典型场景（包含Matlab代码和Python代码实现）

蒙特卡洛方法是一种基于随机抽样的数值计算方法，通过多次随机抽样来估计系统的行为，从而得到系统的统计性质。在风光模型中，蒙特卡洛方法可以用来模拟风速、风向和太阳光照的变化，进而评估风力和太阳能系统在不同条件下的性能。

AtomGit开源社区

蒙特卡洛风光场景并通过削减法聚类法得到几个典型场景（包含Matlab代码和Python代码实现）

AtomGit开源社区

蒙特卡洛风光场景并通过削减法聚类法得到几个典型场景（包含Matlab代码和Python代码实现）

AtomGit开源社区

所有评论(0)

查看更多评论

yfj-unicorn

@m0_74837192

已为社区贡献40条内容

Claude Mythos Preview 发布：Anthropic最强 AI 为什么不向公众开放？

yfj-unicorn

这把剑有多锋利

案例一：OpenBSD，27年前埋下的炸弹

案例二：FFmpeg，500万次自动化测试都没找到

案例三：Linux 内核，从普通用户到全机控制

双刃剑的困境

玻璃翅计划：先把剑交给防御者

最强 AI 为什么不向公众开放？

最后说几句话

所有评论(0)

温馨提示：您尚未绑定手机号

yfj-unicorn