关注 霍格沃兹测试学院公众号,回复「资料」, 领取人工智能测试开发技术合集

导读

如果你最近还在用“写代码效率提升了多少倍”来衡量AI,那已经落后一代了。

真正发生的变化是——“人写代码 → 人调度AI写代码” 的范式切换,已经在头部AI公司内部落地。

Claude 5.0(Mythos)这波内测,不是性能升级那么简单,而是把软件工程的底层逻辑,直接改写了一遍。


目录

  1. Claude 5.0 内测,到底强在哪

  2. 90分钟挖出20年漏洞,这件事的真实含义

  3. AI不只是写代码,而是开始“做安全研究”

  4. Anthropic内部变化:工程师正在消失?

  5. 多智能体协作,正在成为默认开发模式

  6. 对测试开发的冲击:机会与重构

  7. 落地建议:普通工程师该怎么跟上


1、Claude 5.0 内测,到底强在哪

这次曝光的 Claude Mythos 5.0,本质上是一个“顶配级模型”:

  • 规模更大,推理更深

  • 编程能力显著增强

  • 安全能力出现“质变级跃迁”

  • 已集成进 Claude / Claude Code 体系

从定位来看,它类似一个“强化版 Opus”,但更激进:

不只是生成代码,而是能主动发现系统问题

这点,是关键分水岭。

图片

 


2、90分钟挖出20年漏洞,这件事的真实含义

最炸裂的事情,是安全研究员 Nicholas Carlini 的现场演示:

Claude 在约 90 分钟内完成了:

  • 自动分析系统

  • 发现漏洞

  • 编写利用代码

  • 输出完整攻击路径

涉及两个典型场景:

场景一:Ghost CMS

  • 自动发现 SQL 注入漏洞

  • 读取管理员 API Key

  • 获取密码哈希

场景二:Linux 内核(NFSv4)

  • 发现堆栈缓冲区溢出漏洞

  • 该漏洞存在时间:约 20 年

这件事真正的含义不是“AI很强”,而是:

  • AI已经具备自主漏洞挖掘能力

  • 能处理复杂系统级代码(如内核)

  • 不依赖人工引导完成完整攻击链

这已经超出“代码生成”的范畴,进入了:

“系统理解 + 安全推理 + 自动执行”


3、AI不只是写代码,而是开始“做安全研究”

过去AI在安全领域的能力,大多停留在:

  • 简单漏洞扫描

  • 规则匹配

  • 辅助分析

但这次变化是:

能力维度

过去

Claude 5.0

漏洞发现

规则驱动

推理驱动

分析深度

函数级

系统级

利用能力

辅助生成

自动构造

执行方式

人主导

AI主导

这意味着:

AI开始具备“类安全专家”的工作能力

这对整个安全行业、测试行业,都是结构性冲击。


4、Anthropic内部变化:工程师正在消失?

另一个被广泛传播的信息是:

Anthropic内部,工程师已经“几个月不写代码”

图片

 

需要理性看待,这里有两个层面的事实:

真实变化

  • 大量代码由 Claude Code 生成

  • 工程师角色转向:

    • 任务拆解

    • Agent调度

    • 结果校验

  • 多智能体并行成为常态

需要注意的点

  • 并非“完全不写代码”

  • 关键逻辑、复杂系统仍需人工介入

  • AI目前仍存在:

    • 不稳定性

    • 幻觉问题

    • 边界场景失效

所以更准确的说法是:

工程师没有消失,而是从“执行者”变成了“调度者”


5、多智能体协作,正在成为默认开发模式

目前最前沿的开发方式,已经不是:

“一个人 + 一个AI助手”

而是:

“一个人 + 多个AI Agent 并行工作”

典型模式:

需求输入
   ↓
任务拆解 Agent
   ↓
多个执行 Agent(并行)
   ↓
测试 / 校验 Agent
   ↓
汇总输出

在这种模式下:

  • 人不再写代码

  • 人负责“调度 + 控制 +判断”

  • AI负责“执行”


6、对测试开发的冲击:机会与重构

对测试行业来说,这不是坏消息,反而是机会窗口。

正在发生的变化

1)测试对象变化

  • 从“系统” → “AI系统 + Agent系统”

2)测试内容变化

  • 功能正确性 → 推理正确性

  • 接口稳定性 → 行为稳定性

3)测试方法变化

  • 用例驱动 → 数据驱动 / 评测驱动


新能力要求(核心)

  • Prompt设计能力

  • RAG系统理解

  • Agent流程调试能力

  • AI评测体系设计

图片

扫码进群,咨询人工智能测试开发训练营详情

测试工程师,正在向“AI系统验证工程师”演进


7、落地建议:普通工程师该怎么跟上

这波变化,不是未来,是现在。

给三个务实建议:

1)尽快掌握 Agent 工作流

至少要理解:

  • 多Agent如何拆任务

  • 如何并行执行

  • 如何做结果校验


2)从“写代码”转向“设计流程”

重点提升:

  • 任务拆解能力

  • 系统建模能力

  • 自动化流程设计


3)补齐AI工程能力

建议优先学习:

  • RAG(检索增强)

  • 工具调用(Tool Calling)

  • Agent框架(如 LangChain / LangGraph)


结尾

Claude 5.0这波,并不是简单的“模型升级”。

它真正带来的,是一个信号:

软件开发正在从“人写程序”,进入“人调度智能体”的时代

当AI可以:

  • 找漏洞

  • 写代码

  • 跑测试

  • 做决策

那么人类的价值,就只剩下一件事:

定义问题,以及控制系统不失控


如果你是测试工程师,现在要思考的已经不是:

“AI会不会替代我”

而是:

“我能不能成为那个调度AI的人”

关于我们

霍格沃兹测试开发学社,隶属于 测吧(北京)科技有限公司,是一个面向软件测试爱好者的技术交流社区。

学社围绕现代软件测试工程体系展开,内容涵盖软件测试入门、自动化测试、性能测试、接口测试、测试开发、全栈测试,以及人工智能测试与 AI 在测试工程中的应用实践

我们关注测试工程能力的系统化建设,包括 Python 自动化测试、Java 自动化测试、Web 与 App 自动化、持续集成与质量体系建设,同时探索 AI 驱动的测试设计、用例生成、自动化执行与质量分析方法,沉淀可复用、可落地的测试开发工程经验。

在技术社区与工程实践之外,学社还参与测试工程人才培养体系建设,面向高校提供测试实训平台与实践支持,组织开展 “火焰杯” 软件测试相关技术赛事,并探索以能力为导向的人才培养模式,包括高校学员先学习、就业后付款的实践路径。

同时,学社结合真实行业需求,为在职测试工程师与高潜学员提供名企大厂 1v1 私教服务,用于个性化能力提升与工程实践指导。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐