90分钟挖出20年Linux漏洞，Claude 5.0内测曝光：软件工程正在被重写

霍格沃兹测试开发学社

6人浏览 · 2026-03-31 16:54:29

霍格沃兹测试开发学社 · 2026-03-31 16:54:29 发布

关注霍格沃兹测试学院公众号，回复「资料」, 领取人工智能测试开发技术合集

导读

如果你最近还在用“写代码效率提升了多少倍”来衡量AI，那已经落后一代了。

真正发生的变化是——“人写代码 → 人调度AI写代码” 的范式切换，已经在头部AI公司内部落地。

Claude 5.0（Mythos）这波内测，不是性能升级那么简单，而是把软件工程的底层逻辑，直接改写了一遍。

Claude 5.0 内测，到底强在哪
90分钟挖出20年漏洞，这件事的真实含义
AI不只是写代码，而是开始“做安全研究”
Anthropic内部变化：工程师正在消失？
多智能体协作，正在成为默认开发模式
对测试开发的冲击：机会与重构
落地建议：普通工程师该怎么跟上

1、Claude 5.0 内测，到底强在哪

这次曝光的 Claude Mythos 5.0，本质上是一个“顶配级模型”：

规模更大，推理更深
编程能力显著增强
安全能力出现“质变级跃迁”
已集成进 Claude / Claude Code 体系

从定位来看，它类似一个“强化版 Opus”，但更激进：

不只是生成代码，而是能主动发现系统问题

这点，是关键分水岭。

2、90分钟挖出20年漏洞，这件事的真实含义

最炸裂的事情，是安全研究员 Nicholas Carlini 的现场演示：

Claude 在约 90 分钟内完成了：

自动分析系统
发现漏洞
编写利用代码
输出完整攻击路径

涉及两个典型场景：

场景一：Ghost CMS

自动发现 SQL 注入漏洞
读取管理员 API Key
获取密码哈希

场景二：Linux 内核（NFSv4）

发现堆栈缓冲区溢出漏洞
该漏洞存在时间：约 20 年

这件事真正的含义不是“AI很强”，而是：

AI已经具备自主漏洞挖掘能力
能处理复杂系统级代码（如内核）
不依赖人工引导完成完整攻击链

这已经超出“代码生成”的范畴，进入了：

“系统理解 + 安全推理 + 自动执行”

3、AI不只是写代码，而是开始“做安全研究”

过去AI在安全领域的能力，大多停留在：

简单漏洞扫描
规则匹配
辅助分析

但这次变化是：

能力维度	过去	Claude 5.0
漏洞发现	规则驱动	推理驱动
分析深度	函数级	系统级
利用能力	辅助生成	自动构造
执行方式	人主导	AI主导

这意味着：

AI开始具备“类安全专家”的工作能力

这对整个安全行业、测试行业，都是结构性冲击。

4、Anthropic内部变化：工程师正在消失？

另一个被广泛传播的信息是：

Anthropic内部，工程师已经“几个月不写代码”

需要理性看待，这里有两个层面的事实：

真实变化

大量代码由 Claude Code 生成
工程师角色转向：
- 任务拆解
- Agent调度
- 结果校验
多智能体并行成为常态

需要注意的点

并非“完全不写代码”
关键逻辑、复杂系统仍需人工介入
AI目前仍存在：
- 不稳定性
- 幻觉问题
- 边界场景失效

所以更准确的说法是：

工程师没有消失，而是从“执行者”变成了“调度者”

5、多智能体协作，正在成为默认开发模式

目前最前沿的开发方式，已经不是：

“一个人 + 一个AI助手”

而是：

“一个人 + 多个AI Agent 并行工作”

典型模式：

需求输入
   ↓
任务拆解 Agent
   ↓
多个执行 Agent（并行）
   ↓
测试 / 校验 Agent
   ↓
汇总输出

在这种模式下：

人不再写代码
人负责“调度 + 控制 +判断”
AI负责“执行”

6、对测试开发的冲击：机会与重构

对测试行业来说，这不是坏消息，反而是机会窗口。

正在发生的变化

1）测试对象变化

从“系统” → “AI系统 + Agent系统”

2）测试内容变化

功能正确性 → 推理正确性
接口稳定性 → 行为稳定性

3）测试方法变化

用例驱动 → 数据驱动 / 评测驱动

新能力要求（核心）

Prompt设计能力
RAG系统理解
Agent流程调试能力
AI评测体系设计

扫码进群，咨询人工智能测试开发训练营详情

测试工程师，正在向“AI系统验证工程师”演进

7、落地建议：普通工程师该怎么跟上

这波变化，不是未来，是现在。

给三个务实建议：

1）尽快掌握 Agent 工作流

至少要理解：

多Agent如何拆任务
如何并行执行
如何做结果校验

2）从“写代码”转向“设计流程”

重点提升：

任务拆解能力
系统建模能力
自动化流程设计

3）补齐AI工程能力

建议优先学习：

RAG（检索增强）
工具调用（Tool Calling）
Agent框架（如 LangChain / LangGraph）

结尾

Claude 5.0这波，并不是简单的“模型升级”。

它真正带来的，是一个信号：

软件开发正在从“人写程序”，进入“人调度智能体”的时代

当AI可以：

找漏洞
写代码
跑测试
做决策

那么人类的价值，就只剩下一件事：

定义问题，以及控制系统不失控

如果你是测试工程师，现在要思考的已经不是：

“AI会不会替代我”

而是：

“我能不能成为那个调度AI的人”

关于我们

霍格沃兹测试开发学社，隶属于 测吧（北京）科技有限公司，是一个面向软件测试爱好者的技术交流社区。

学社围绕现代软件测试工程体系展开，内容涵盖软件测试入门、自动化测试、性能测试、接口测试、测试开发、全栈测试，以及人工智能测试与 AI 在测试工程中的应用实践。

我们关注测试工程能力的系统化建设，包括 Python 自动化测试、Java 自动化测试、Web 与 App 自动化、持续集成与质量体系建设，同时探索 AI 驱动的测试设计、用例生成、自动化执行与质量分析方法，沉淀可复用、可落地的测试开发工程经验。

在技术社区与工程实践之外，学社还参与测试工程人才培养体系建设，面向高校提供测试实训平台与实践支持，组织开展 “火焰杯” 软件测试相关技术赛事，并探索以能力为导向的人才培养模式，包括高校学员先学习、就业后付款的实践路径。

同时，学社结合真实行业需求，为在职测试工程师与高潜学员提供名企大厂 1v1 私教服务，用于个性化能力提升与工程实践指导。

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

医疗AI智能体：构筑长效对话链路：智能体多轮对话记忆机制与上下文完整处理实际.132

AtomGit开源社区

15天(带你深入浅出学会C)01

AtomGit开源社区

ClaudeCode 源码完整解读：从 60+ 模块51万行源码学习如何构建生产级 AI Agent 系统

AtomGit开源社区

所有评论(0)

查看更多评论

霍格沃兹测试开发学社

@Hogwartstester

已为社区贡献40条内容

90分钟挖出20年Linux漏洞，Claude 5.0内测曝光：软件工程正在被重写

霍格沃兹测试开发学社

导读

目录

1、Claude 5.0 内测，到底强在哪

2、90分钟挖出20年漏洞，这件事的真实含义

场景一：Ghost CMS

场景二：Linux 内核（NFSv4）

3、AI不只是写代码，而是开始“做安全研究”

4、Anthropic内部变化：工程师正在消失？

真实变化

需要注意的点

5、多智能体协作，正在成为默认开发模式

6、对测试开发的冲击：机会与重构

正在发生的变化

新能力要求（核心）

7、落地建议：普通工程师该怎么跟上

1）尽快掌握 Agent 工作流

2）从“写代码”转向“设计流程”

3）补齐AI工程能力

结尾

关于我们

所有评论(0)

霍格沃兹测试开发学社