这两年,测试领域里和 AI 相关的词越来越多:

Prompt、MCP、Agent、Skills、OpenClaw……

很多时候,这些词会被放在一起讲,听起来都和“AI 更智能了”有关。

但如果你真的要开发一个企业级 AI 测试用例系统,就会很快发现:

这些词根本不是同一层的概念。
它们分别解决的是完全不同的技术问题。

如果不把它们的边界讲清楚,系统就很容易做成一个“什么都沾一点,但架构并不清晰”的拼装体。

这篇文章不讲泛概念,只讲一个非常具体的问题:

如果目标是输入需求文档、设计文档、接口信息,输出可审查、可扩展、可导出的测试对象、测试场景和测试用例,那么 Prompt、MCP、Agent、Skills、OpenClaw 在技术上各自意味着什么?


先说结论:它们不在同一层

如果从技术分层来看,这几个词大致可以这样理解:

  • Prompt:任务指令层

  • Skills:可复用方法层

  • Agent:任务执行与决策层

  • MCP:外部能力接入协议层

  • OpenClaw:Agent 运行与编排框架层

MCP 官方文档把 server 暴露给 AI 的核心能力分成resources 、prompts、tools:resources 提供上下文数据,prompts 提供结构化提示模板,tools 提供可调用的外部能力。

OpenAI  对 agents 的定义则更偏执行系统:agent 是能结合上下文、工具和多步流程来完成任务的系统,而不只是一次性文本生成。

OpenAI 对 skills 的定义也很明确:skill 是一个带 SKILL.md  的版本化能力包,用来把流程、规范和方法沉淀成可复用模块。

OpenClaw 的公开文档则说明,它使用 AgentSkills-compatible 的 skill 目录,每个 skill 都有一个 SKILL.md,并按环境与配置加载。

所以,从工程视角看,它们分别回答的是不同问题:

  • Prompt:这一轮模型该怎么做?

  • Skill:这类任务长期应该怎么做?

  • Agent:现在该调什么能力、按什么顺序执行?

  • MCP:怎么把外部资源和能力标准化接进来?

  • OpenClaw:这些 agent 和 skills 跑在哪个宿主里?


1. Prompt:在测试用例系统里,它是“单步任务的控制指令”

很多人最先接触的是 prompt。

因为它最直观。

在测试用例场景里,一个 prompt 可能是这样的:

你是一名资深测试分析师

请根据 PRD 和接口文档识别测试对象

优先关注状态迁移、异常链路、权限控制和边界条件

输出严格 JSON,不要输出额外解释

从技术上看,prompt 的本质是传给模型的一段任务控制文本。

它主要负责四件事:

  1. 定义当前任务目标

  2. 规定模型当前扮演的角色

  3. 约束输入该如何理解

  4. 约束输出格式和边界

所以,如果把测试用例系统拆开看,prompt 最常见的落点其实有三类 :

第一类:任务级 prompt

比如直接要求“生成测试用例”“补充异常场景”“做覆盖检查”。

第二类:阶段级 prompt

比如只做“需求分析”、只做“测试对象识别”、只做“测试场景展开”。

第三类:格式级 prompt

比如要求输出成固定 JSON schema、某种导入模板,或者企业内部的某套结构。

这也是为什么,prompt 在测试系统里当然重要,但它的边界也很清楚:

它解决的是“这一轮怎么做”,
不是“整个系统长期怎么工作”。

也就是说,prompt 更像某一步执行时传给模型的控制参数,而不是系统本身的能力骨架。


2. Skills:在测试用例系统里,它是“测试方法的可复用封装”

如果说 prompt 是“这次怎么做”,

那么 skill 更像是“这类事长期应该怎么做”。

OpenAI 官方对 skill 的描述很有代表性:一个 skill 会打包 instructions、resources 和可选 scripts,用来让 agent 更可靠地遵循某个 workflow;skill 本身通常以 SKILL.md 作为核心说明文件。

放到测试用例系统里,skill 的技术含义非常具体:

把测试专家的方法,沉淀成可被 agent 自动识别、重复调用、长期维护的能力模块。

例如,你完全可以把测试系统拆成一组 skills:

requirement-analysis skill

负责从 PRD、设计文档、业务规则里抽取:

  • 业务事件

  • 功能义务

  • 前置条件

  • 分支路径

  • 状态变化

  • 外部依赖

test-object-planning skill

负责把需求拆成:

业务功能对象

数据处理对象

权限控制对象

异常处理对象

配置驱动对象

状态迁移对象

boundary-mining skill

负责系统性检查:

  • 输入边界

  • 状态边界

  • 时间边界

  • 配置边界

  • 并发边界

  • 特殊值与非法值

coverage-review skill

负责在最终输出前检查:

  • 主流程是否覆盖

  • 异常流程是否覆盖

  • 状态切换是否覆盖

  • 权限和角色是否覆盖

  • 回滚、恢复、组合条件是否遗漏

所以 skill 和 prompt 的最大不同在于:

prompt 是单次任务指令,
skill 是长期复用的方法单元。

从工程上讲,skill 更适合企业系统。

因为企业真正需要的,不是每次有人重新写一遍“怎么做测试对象分析”,而是把这套成熟方法沉淀下来,形成稳定能力。


3. Agent:在测试用例系统里,它不是“会聊天”,而是“会判断、会调度、会校验”

Agent 是最容易被说虚的一个词。

如果不落到工程实现里,agent 很容易被描述成“更聪明的 AI”。

但技术上,这样说并没有帮助。

更准确的说法是:

Agent 是围绕目标任务,负责判断、拆解、调用能力、处理异常和校验结果的执行控制器。

OpenAI 的 agents 文档把 agent 定义为能结合工具、上下文和多步流程完成任务的系统,而不是单次生成一个回答。

在测试用例场景里,agent 通常负责这些工作:

1)输入判断

  • 检查用户给的输入够不够:

  • 只有 PRD?

  • 有没有接口文档?

  • 有没有状态机定义?

  • 是否缺少关键字段约束?

2)任务拆解

决定当前任务是不是应该分阶段:

  • 先做需求分析

  • 再做测试对象规划

  • 再做测试场景生成

  • 最后做覆盖率审查

3)能力选择

判断现在该调哪个 skill:

  • 原始文档进来时先走 requirement-analysis

  • 已经有 requirement objects 时走 test-object-planning

  • 已经生成 case 草稿时走 coverage-review

4)工具调用

当需要外部信息时,去调用:

  • 接口 schema

  • 配置中心

  • 缺陷系统

  • 测试资产库

  • 导出系统

5)结果校验与回退

如果发现:

  • 输出结构不合法

  • 某些关键对象缺失

  • 某条规则存在冲突

  • 覆盖率明显不足

agent 可以决定:

  • 重试某一步

  • 切换 skill

  • 补查外部信息

  • 标记人工确认点

所以,如果说 prompt 负责“这一轮怎么说”,skill 负责“这类事怎么做”,

那么 agent 负责的就是:

现在到底该做哪件事、先做哪一步、用什么方法做、做完怎么检查。

这也是为什么,企业级测试用例系统最终不能只是“prompt + 知识库”,而往往会走向 agent 结构。


4. MCP:在测试用例系统里,它是“把外部资源和能力标准化接进来的协议层”

MCP 这两年讨论很多,但在测试场景里,它最核心的技术意义其实非常简单:

它不是测试方法,也不是推理能力,
它是让 AI 系统能够以统一方式连接外部资源和工具的标准接口。

MCP 官方把它定义为连接 AI 应用与外部数据源和工具的开放协议,并把能力拆成 resources、prompts、tools 三类。

放到测试用例系统里,MCP 的作用可以直接落到三件事上:

1)暴露上下文资源

通过 resources 提供:

  1. PRD

  2. 接口文档

  3. 数据 schema

  4. 状态机配置

  5. 历史缺陷摘要

  6. 测试规范

这类数据属于“上下文资源”。

2)暴露可执行能力

通过 tools 提供:

  • analyze_requirements

  • plan_test_objects

  • generate_test_scenarios

  • generate_test_cases

  • review_coverage

  • export_test_cases

这类能力属于“可执行动作”。

3)暴露结构化模板

通过 prompts 提供:

  • requirement analysis 模板

  • scenario generation 模板

  • compliance review 模板

所以,MCP 在测试系统里的真正价值不是“让 AI 更聪明”,而是:

让测试系统能够被标准化接入企业环境,也让企业自己的 agent 能标准化调用你的测试能力。

这也是为什么,从技术角度看,“Treeify 的 MCP 是 agent-as-tool ”这个说法是成立的。

因为外部系统表面看到的是一个 tool,但这个 tool 背后不一定是简单函数,也可能是一个完整的测试分析 agent。


5. OpenClaw:在测试用例系统里,它更像“Agent 的宿主和编排环境”

最后说 OpenClaw。

从技术视角看,OpenClaw 不是测试方法本身,也不是测试用例生成算法。

它更接近一个agent runtime / 编排宿主。

公开文档里,OpenClaw 明确说明它使用 AgentSkills-compatible 的 skill 文件夹,每个 skill 都带一个 SKILL.md,系统会按环境、配置和依赖决定加载哪些 skills。

这意味着,如果把它放进测试用例场景里,它的角色通常是:

  • 承载 agent 的运行

  • 装载本地或外部 skills

  • 让模型知道有哪些 skill 可用

  • 在需要时读取 SKILL.md

  • 调用 tools 或外部服务

换句话说,OpenClaw 本身不等于“测试能力”,

它更像是一个能运行测试能力的环境。

如果用一个更直观的方式理解:

  • skill是能力包

  • agent是执行者

  • OpenClaw是执行者跑起来的工作台

例如,一个企业完全可以这样工作:

  • 用 OpenClaw 作为 agent 宿主

  • 在 OpenClaw 中配置 testing skills

  • 通过 MCP 接入 Treeify 的专业测试分析能力

  • 由外层 agent 统一调度流程

  • 由 Treeify 作为测试专业节点完成需求分析、测试对象识别、测试场景和测试用例生成

这就是一个非常典型的“OpenClaw + skills + MCP + 专业测试 agent”组合。


6. 最容易混淆的几个地方

在技术讨论里,下面几组概念最容易混。

Prompt 和 Skill 的区别

  • Prompt 是一次执行时的任务指令。

  • Skill 是长期复用的方法封装。

一句话区分:

prompt 是“这次怎么说”,skill 是“这类事一直怎么做”。

Skill 和 Agent 的区别

  • Skill 提供专业方法。

  • Agent 负责决定什么时候调用哪个 skill,并把多个 skill 串成任务流程。

一句话区分:

skill 提供能力,agent 组织能力。

MCP 和 Tool 的区别

  • Tool 是一个具体动作。

  • MCP 是把这些动作和资源暴露出来的标准方式。

一句话区分:

tool 是能力本身,MCP 是接入协议。

OpenClaw 和 Agent 的区别

Agent 是逻辑角色。

OpenClaw 是承载 agent 的运行环境之一。

一句话区分:

agent 是谁在做事,OpenClaw 是它跑在哪。


7. 为什么企业级 AI 测试用例系统,一定会走向这几个层次的组合?

如果只做 Demo,一个 prompt + 一个文档上传入口,可能已经能生成一些“像样”的测试用例。

但如果目标是企业级系统,问题就会变成:

  • 方法如何复用?

  • 任务如何分解?

  • 上下文如何接入?

  • 外部系统如何连接?

  • 能力如何嵌入现有 agent 体系?

  • 整个流程如何长期维护?

也正因为如此,今天真正往企业落地的 AI 测试系统,重点已经不再是“谁写了一个更长的 prompt”,而是:

谁能把测试方法工程化,
谁能把能力模块化,
谁能把外部系统标准化接进来,
谁能让整个测试分析流程真正跑起来。


结尾:从技术上看,企业级 AI 测试不是“一个模型”,而是一套分层系统

如果用一句话收束这篇文章,我会这样说:

在测试用例系统里,Prompt 负责单步指令,Skills 负责方法复用,Agent 负责任务治理,MCP 负责外部接入,OpenClaw 负责运行和编排。

把这几层混在一起,很容易把系统做成“看起来什么都懂,实际边界不清”。

把这几层拆清楚,才有机会做出真正可维护、可扩展、可接企业环境的 AI 测试能力系统。这也是为什么,今天讨论 AI 测试时,真正值得关注的已经不只是“模型能不能生成测试用例”,而是:这套系统到底是怎么工作的。

感谢每一个认真阅读我文章的人!!!

作为一位过来人也是希望大家少走一些弯路,如果你不想再体验一次学习时找不到资料,没人解答问题,坚持几天便放弃的感受的话,在这里我给大家分享一些自动化测试的学习资源,希望能给你前进的路上带来帮助。

软件测试面试文档

我们学习必然是为了找到高薪的工作,下面这些面试题是来自阿里、腾讯、字节等一线互联网大厂最新的面试资料,并且有字节大佬给出了权威的解答,刷完这一套面试资料相信大家都能找到满意的工作。

 

          视频文档获取方式:
这份文档和视频资料,对于想从事【软件测试】的朋友来说应该是最全面最完整的备战仓库,这个仓库也陪伴我走过了最艰难的路程,希望也能帮助到你!以上均可以分享,点下方小卡片即可自行领取。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐