几周挖出上万高危漏洞！Claude Mythos玻璃翼项目成绩震撼安全圈

SuaniCommunity

248人浏览 · 2026-05-26 17:00:41

SuaniCommunity · 2026-05-26 17:00:41 发布

一个月前，Anthropic联合多家科技巨头启动了Project Glasswing（玻璃翼项目）：Anthropic神话模型发布，但不让你用。

初衷是要在越发强大的人工智能模型被恶意利用前，提前把全球最核心的软件加固一遍。现在第一份初期成绩单已经交出。

尚未公开发布的Claude Mythos Preview模型，在短短几周内，就在全球最重要的软件中找出了超1万个高危或严重漏洞。

人工智能彻底颠覆了网络安全的攻防节奏，寻找漏洞变得轻而易举。人类验证与披露以及修复漏洞的速度已经严重滞后。

找漏洞变简单

软件行业有个延续多年的习惯做法，新漏洞被发现后，通常需要等待90天才会对外公布。

开发者刚好可以利用时间差写出补丁。用户及时更新软件，就能把黑客挡在门外。为了保护全球终端用户的安全，内部也严格遵守协调漏洞披露政策。

现实情况让人十分为难。

公开披露的漏洞数据，往往严重滞后于前沿人工智能模型真实的网络能力。直接向大众公布所有细节依然面临巨大风险。

Anthropic只能通过部分典型案例与汇总数据，带大家一窥Mythos预览版的强悍实力。等到漏洞补丁被广泛部署后，他们才分享更多技术细节。

参与玻璃翼项目的50多家首批合作伙伴，都在构建并维护着支撑互联网以及其他核心基础设施的底层软件。修复底层代码的缺陷，能成倍降低无数关联企业的风险，最终保护数十亿终端用户。

仅仅一个月时间，大多数合作伙伴都在自家软件中发现了数百个严重或高危漏洞。大家汇总起来的数量已经超过了1万个。多家机构反馈，找出代码缺陷的速度直接飙升了10倍以上。

以Cloudflare为例，安全团队在关键路径系统中揪出了2000个程序错误。里面有400个属于高危或严重级别。团队成员反馈，人工智能给出的假阳性率甚至比人类测试员还要低。

Mozilla（火狐母公司）在测试Firefox 150时，利用Mythos预览版发现并修复了271个漏洞。数量是他们在Firefox 148中使用Claude Opus 4.6找到的10倍以上。

外部测试同样印证了模型能力的代际跨越。

UK AI Security Institute（英国人工智能安全研究所）报告称，Mythos预览版是首个能端到端解决他们网络靶场所有问题的模型。靶场主要模拟复杂的多步骤网络攻击。XBOW（独立安全平台XBOW）在网络漏洞利用基准测试中发现，模型在标记匹配的精准度上史无前例。

近期发布的两个学术基准测试ExploitBench（漏洞利用基准测试ExploitBench）和ExploitGym（漏洞利用基准测试ExploitGym）里，Mythos预览版也表现出压倒性的最强性能。

不仅是挖掘代码缺陷，人工智能在真实防御场景中同样敏锐。

一家合作银行曾遭遇真实的网络攻击。黑客入侵了客户电子邮件账户并拨打欺骗性电话，试图神不知鬼不觉地转走150万美元。Mythos预览版成功协助银行检测并拦截了该笔欺诈电汇。

打好补丁的软件正在以惊人的速度发布。

Palo Alto Networks最新发布的补丁数量是平时的5倍多。

微软公开表示，未来一段时间内新补丁发布数量会继续保持增长。

甲骨文在各类产品和云服务中发现并修复漏洞的速度，也比以往快了数倍。

开源软件的体检报告

过去几个月里，模型扫描了1000多个开源项目。无数开源项目是整个互联网运转的基石。科技巨头们的基础设施也深度依赖它们。

扫描结果触目惊心。

在23019个总漏洞中，Mythos预览版估测有6202个属于高危或严重级别。为了验证人工智能判断的准确性，六家独立安全研究公司以及内部团队，对其中1752个高危或严重漏洞进行了细致的人工评估。

评估通过的有效真实阳性漏洞达到1587个，占比高达90.6%。其中1094个被确认为高危或严重级别，占比为62.4%。

按照目前的验证通过率，即使Mythos预览版从此刻起停止扫描，也有望在开源代码中确认近3900个高危或严重漏洞。相关团队计划继续扫描开源代码，后续确认的漏洞数量必定会继续攀升。

我们用一个具体案例来感受潜在破坏力。

wolfSSL（开源密码库wolfSSL）是一个以安全性著称的代码库，全球有数十亿台设备在使用它。Mythos预览版在里面发现了一个隐蔽的漏洞，并直接构建了漏洞利用程序。

攻击者利用程序可以伪造证书。黑客借此可以搭建一个虚假的银行或电子邮件网站。终端用户看到的网站非常逼真，根本无法分辨真假。好在漏洞目前已被修复并分配了编号CVE-2026-5194。完整的技术分析将在几周内发布。

找漏洞变得无比简单，验证、报告、设计和部署补丁的人力却远远跟不上。

下表展示了开源漏洞扫描与处理的进展数据，涵盖了所有严重级别的漏洞。表格数据充分反映了不同阶段的断崖式下跌，验证和修复每一个漏洞都需要耗费巨大的人力成本。

漏洞分类验证繁琐复杂。外部安全公司或内部团队需要先复现模型找到的问题，重新评估严重程度。

确认漏洞真实存在后，还要检查是否有现成的修复方案，最后给软件维护者撰写详细报告。整个流程不仅耗时，还考验研究员的耐心。

开源软件的维护者们正面临巨大压力。他们大部分是依靠热爱的志愿者。

他们不仅要处理日常繁杂的维护工作，还要面对潮水般涌来的人工智能生成的低质量错误报告。多位维护者坦言目前人力严重短缺。部分维护者甚至主动要求放慢漏洞披露速度，因为他们需要更多时间来设计补丁。

平均下来修复一个由Mythos预览版发现的高危或严重漏洞，需要整整两周时间。应维护者的要求，有时团队会跳过进一步评估，将发现的问题直接提交。

在已披露的530个高危或严重漏洞中，只有75个完成了补丁修复，其中65个发布了公共建议。

修复数量偏低主要有三个原因。一是在90天协调漏洞披露期的早期，预计不久会有大量补丁落地。二是部分漏洞修复并未发布公共建议，只能依靠模型自行扫描发现，存在统计上的遗漏。三是根本性难题，找漏洞太容易而修漏洞太难。

安全生态系统早已超载，即便是缓慢的漏洞披露节奏，也让底层的维护者不堪重负。

防御者的应对策略

具备强大网络安全技能的人工智能模型很快就会普及。整个软件行业必须联合起来，共同应对海量的漏洞报告。

漏洞被发现、开发补丁、用户部署补丁，三个环节之间存在着漫长的时间差。黑客可以趁机攻击核心软件。

新一代模型大幅降低了发现和利用漏洞的时间与成本，无形中放大了时间差带来的系统性风险。

长远来看开发者能在软件发布前揪出漏洞，打造出更安全的代码。身处新旧交替的过渡期，漏洞发现快而修复慢，带来了前所未有的安全隐患。

软件开发者和用户必须立即行动。开发者应尽可能缩短补丁周期，尽快提供安全修复。合理使用公开的人工智能模型可以提供巨大帮助。开发者还需优化更新流程，让用户能轻松安装补丁，尽最大可能督促那些仍在使用已知漏洞软件的用户进行升级。

网络防御者需要缩短补丁测试与部署的时间线。National Institute of Standards and Technology（美国国家标准与技术研究院）和UK National Cyber Security Centre（英国国家网络安全中心）等机构提出的关键控制措施，现在显得尤为重要。强化网络的默认配置，强制执行多因素身份验证，保留全面的日志用于检测和响应，都能在没有及时打补丁的情况下大幅提升安全性。

目前市面上公开可用的模型，虽然无法像Claude Mythos预览版那样找出最复杂的漏洞或进行深度利用，但已经能发现大量软件缺陷。

玻璃翼项目带动了许多机构利用公开模型审查自家代码。团队正在努力降低工具的使用门槛。

Claude Enterprise客户现在可以体验公开测试版的Claude Security。工具能协助团队扫描代码库中的漏洞，并自动生成修复建议。发布短短三周内，客户利用Claude Opus 4.7修复了超过2100个漏洞。企业修复内部代码的速度远高于依赖志愿者协调披露的开源社区。

Anthropic已启动Cyber Verification Program（网络验证计划）。从事漏洞研究、渗透测试和红队测试的专业安全人员，在合法网络安全工作场景下，可以豁免某些旨在防止网络滥用的安全限制。

团队正向符合条件的客户安全团队开放Mythos预览版的相关配套工具，力求无需繁杂设置，就能让公开模型发挥最佳性能。

新发布的工具包包含Anthropic与合作伙伴共同开发共享的Skills，用于处理重复性的基础工作。

Harness可以协助模型映射代码库、启动扫描子代理、对发现的问题进行分类并撰写报告。

Threat model builder（威胁模型构建器）通过映射代码库识别潜在攻击目标，并为模型安排工作优先级。

玻璃翼项目的合作伙伴Cisco（思科）最近也开源了其Foundry Security Spec（铸造厂安全规范），帮助其他防御者构建类似的安全评估系统。

Anthropic与Open Source Security Foundation（开源安全基金会）的Alpha-Omega达成合作，协助维护者处理和分类漏洞报告。

技术进步一日千里。未来各大人工智能公司都会开发出媲美Mythos预览版的模型。

目前包括Anthropic在内的任何公司，都还没能开发出足够强大的安全护栏，彻底防止新模型被恶意滥用并造成严重危害。

一旦缺乏护栏的模型被公开发布，世界上几乎任何人利用残缺软件发起攻击的成本和门槛都会大幅降低。

玻璃翼项目让全球最核心的网络防御者获得了不对称的防守优势。

在不久的将来，当开发出足够强大的安全护栏后，Mythos级别的新一代模型或将走向公众。

AI找漏洞太快，人类根本修不完。

相信还会有更多领域会出现这种AI把人类在身后的情况。

参考资料：

https://www.anthropic.com/research/glasswing-initial-update

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

2024科技趋势：AI领跑，云边协同

2024年技术发展将围绕人工智能、云计算、边缘计算等核心领域展开，重点关注技术融合与实际应用场景的落地。技术发展将更强调“价值闭环”，即从技术创新到商业变现的路径缩短，同时跨领域协作（如AI+生物科技）可能催生突破性应用。

AtomGit开源社区

2024技术趋势：AI领跑，开发者必看22

强调技术快速迭代中持续学习的重要性，鼓励读者关注实践与理论结合。（注：可根据实际需求调整子标题深度或增删模块，如加入“行业案例”或“争议性技术讨论”等部分。

AtomGit开源社区

使用Koopman理论识别机器人动力学的非线性系统（Matlab代码实现）

实际中的大多数系统均为非线性系统，而Koopman算子可以描述非线性系统的可观测状态量在高维空间中的线性演化过程，可以将非线性问题转化为线性问题，对于非线性系统的研究有较大的价值。利用Koopman算子理论，可以仅依靠实验数据或系统仿真数据建立非线性系统的线性模型，基于该模型可实现对非线性系统的分析、预测和控制[6]。为了识别杜宾汽车模型的非线性动力学，我们使用Koopman算子理论首先从系统的仿