原创内容,未获授权禁止转载、转发、抄袭。

前两篇分别讲了:

第一篇:AI 如何辅助需求拆解和用例设计
第二篇:如何把用例落到 Playwright 自动化脚本

这一篇继续讲最后一环:自动化跑完以后,怎么让 AI 分析失败原因,并接入质量门禁。

很多团队的自动化并不是没有跑,而是跑完以后没人看。

每天群里丢一堆失败截图、失败日志、测试报告,最后还得测试同学人工点进去查原因。

所以我觉得,AI 在测试里特别有价值的地方,不只是“写用例”和“写脚本”,而是:

帮测试团队把失败结果变成可读的风险结论。


一、本篇解决什么问题

这篇重点解决三个问题:

  1. 自动化失败后,怎么快速判断失败原因
  2. 测试报告怎么从“通过率”变成“风险结论”
  3. AI 分析结果怎么接入质量门禁,影响发布判断

也就是说,这一篇关注的是测试闭环的最后一步:
在这里插入图片描述


二、AI 分析测试失败原因,比 AI 写用例更有价值

自动化失败后,经常会遇到这些情况:

失败现象 可能原因
元素找不到 页面改版、加载慢、定位不稳定
断言失败 文案变化、业务状态异常
接口返回 500 后端服务异常、测试数据污染
超时 环境慢、接口阻塞、前端资源加载失败
偶现失败 用例依赖顺序、数据未清理、异步等待不足

如果每次都靠人工判断,非常耗时间。

更好的方式是:
把失败日志、截图描述、接口返回结果交给 AI,让它先做一次归因。


三、失败分析提示词模板

可以直接使用下面这个模板:

你是一名测试负责人,请分析下面自动化测试失败原因。

请按以下结构输出:
1. 失败现象
2. 最可能原因
3. 需要进一步确认的信息
4. 建议排查步骤
5. 是否可能是产品缺陷、脚本问题、环境问题
6. 风险等级:高/中/低
7. 是否建议阻断发布

测试日志:
粘贴日志

接口返回:
粘贴接口响应

截图描述:
粘贴截图关键信息

AI 输出的结果可以整理成这样:

项目 分析结果
失败现象 提交订单后未出现“订单提交成功”
最可能原因 提交订单接口返回 500
问题类型 后端服务异常,非脚本问题
建议排查 查看订单服务日志,确认库存扣减接口是否异常
风险等级
是否阻断发布

在这里插入图片描述


四、测试报告不要只看通过率

很多自动化报告只有一个通过率:

总用例数:120
通过:110
失败:10
通过率:91.7%

这类报告只能说明“有多少失败”,但不能说明“风险有多大”。

测试负责人更关心的是:

关注点 说明
哪些核心链路失败 登录、下单、支付、权限等
失败是否可复现 偶现还是稳定失败
是脚本问题还是产品问题 是否需要提缺陷
是否影响发布 是否触发质量门禁
是否有同类问题 是否需要批量排查
是否有人认领 失败结果不能无人处理

所以报告应该从“统计结果”升级成“风险结论”。


五、建议输出一份风险摘要

每天自动化跑完后,建议不要只发原始报告链接。

可以让 AI 生成一份风险摘要:

今日自动化测试风险摘要

执行概况:
- 总用例数:120
- 通过:110
- 失败:10
- 通过率:91.7%

高风险问题:
1. 订单提交失败,接口返回 500,影响核心下单链路,建议阻断发布
2. 支付回调断言失败,需要确认支付状态同步逻辑

中风险问题:
1. 优惠券列表加载偶发超时,建议关注环境稳定性
2. 后台商品配置页元素定位失败,疑似页面改版导致脚本失效

初步判断:
- 产品缺陷:2 个
- 脚本问题:3 个
- 环境问题:5 个

发布建议:
当前存在核心链路失败,不建议发布。

这类报告比单纯的通过率更有价值。

因为它直接告诉团队:当前版本到底能不能发。


六、质量门禁怎么设计

如果自动化只是“跑一下看看”,价值有限。

建议把关键用例接入发布流程:
在这里插入图片描述

质量门禁可以先不用太复杂,最开始只拦核心问题:

门禁项 建议规则
冒烟测试 核心冒烟用例必须 100% 通过
核心接口 登录、下单、支付、权限接口必须通过
P0/P1 缺陷 不允许存在未关闭问题
自动化失败 必须有人确认失败原因
风险摘要 必须输出是否建议发布
人工豁免 必须记录豁免原因和负责人

这里要注意一个点:

质量门禁不是为了卡人,而是为了把风险提前暴露出来。

如果失败原因明确是脚本问题,可以走人工确认;
如果失败原因是核心链路产品缺陷,就应该阻断发布。


七、报告分析和门禁最容易踩的坑

这一部分不再重复“用例怎么写、数据怎么管”,重点说报告和门禁自己的坑。

1. 只看通过率,不看失败影响面

通过率 95% 不一定安全。

如果失败的是核心下单链路,那风险比 20 条非核心页面脚本失败更高。

2. 不区分产品问题、脚本问题和环境问题

所有失败都混在一起,会导致团队对自动化失去信任。

建议至少分成三类:

类型 处理方式
产品问题 提缺陷,视等级决定是否阻断
脚本问题 修复脚本,不直接阻断发布
环境问题 记录环境原因,必要时重跑

3. 门禁规则一上来就太严

刚开始落地时,不建议所有失败都阻断发布。

可以先只拦核心链路,比如:

  • 登录失败
  • 下单失败
  • 支付主流程失败
  • 权限校验失败
  • P0/P1 缺陷未关闭

等团队稳定后,再逐步提高门禁要求。

4. 没有人工豁免机制

实际项目中总会遇到特殊情况。

比如某条脚本因为测试环境异常失败,但人工验证业务没问题。

这时候可以允许豁免,但必须记录:

  • 豁免原因
  • 负责人
  • 有效时间
  • 后续修复计划

5. 报告没人认领

自动化失败不可怕,可怕的是没人处理。

建议每次失败摘要里都带上责任归属:

问题类型 默认责任人
产品缺陷 对应开发负责人
脚本问题 测试开发或用例维护人
环境问题 环境维护人
数据问题 测试数据负责人

八、团队落地路径

如果团队刚开始尝试 AI 测试,不建议一步到位。

可以分三阶段推进。

第一阶段:AI 辅助分析失败日志

先不要急着接门禁。

目标是让 AI 帮测试人员节省排查时间。

适合场景:

  • 自动化失败日志分析
  • 接口报错摘要
  • 截图和报错信息归因
  • 失败原因初步分类

第二阶段:生成每日风险摘要

当失败分析比较稳定后,可以让 AI 每天生成风险摘要。

重点包括:

  • 今日执行概况
  • 高风险失败
  • 失败分类
  • 是否建议发布
  • 待认领问题

第三阶段:接入质量门禁

最后再接入发布流程。

先拦核心链路,再逐步扩大范围。

比如第一阶段只拦:

  • 登录失败
  • 下单失败
  • 支付失败
  • 权限失败
  • P0/P1 缺陷未关闭

这样门禁更容易被团队接受。


九、一个比较实用的 AI 测试落地架构

最终可以形成下面这种结构:
在这里插入图片描述

这里面最重要的不是某一个工具,而是流程闭环。

没有闭环,AI 只是玩具。
有了闭环,AI 才能变成测试生产力。


十、总结

这一篇主要讲自动化执行后的闭环。

核心结论:

  1. AI 分析失败原因,比单纯生成用例更容易产生价值
  2. 测试报告不要只看通过率,要输出风险结论
  3. 失败问题要区分产品问题、脚本问题和环境问题
  4. 质量门禁要先从核心链路开始,不要一上来过严
  5. 门禁必须支持人工豁免,但要记录原因和负责人
  6. 自动化结果只有影响发布判断,才真正进入质量体系

AI 测试真正闭环的标志,不是生成了多少用例,也不是跑了多少脚本。

而是自动化结果能够回答一个问题:

当前版本的主要风险是什么,是否可以发布?

能回答这个问题,AI 测试才算真正落地。


Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐