测试最终章：让大模型自动测试，让大模型去点点点，broser-use

空城雀

187人浏览 · 2026-05-13 11:04:37

空城雀 · 2026-05-13 11:04:37 发布

大家都知道自动化测试，无论是selenium、playwright，还是其他，都是通过控制页面元素，比如css、xpath等来实现代码去自动点点点。
大模型出来之后，可以实现让大模型去写自动化测试代码，方便了很多。
那能不能不写代码，直接让大模型像人一样去点点点呢？

可以的！
但提前说好，现阶段实战的话，肯定是不如人那么好，但可以让它去测一下简单的功能，也省不少事。

一、安装

我用的是browse-use，下面说一下保姆级安装过程
步骤 1：安装 Python 3.11+（如未安装）
首先检查你的 Python 版本：

bash
python --version # 应该显示 Python 3.11.x 或更高
如果版本低于 3.11，请去 Python 官网下载安装包，安装时务必勾选 “Add Python to PATH”。

步骤 2：新建项目并安装 uv
uv是比pip好的一种安装工具
bash

创建并进入项目目录

mkdir browser-use-demo && cd browser-use-demo

安装 uv（推荐的新型 Python 包管理器，速度比 pip 快 10-100 倍）

pip install uv

为什么推荐 uv？因为 Browser Use 官方文档明确推荐使用 uv 进行安装和环境管理，两条官方指引的快速安装路径都基于 uv 实现。

步骤 3：通过 uv 创建虚拟环境
bash
创建 Python 3.11+ 虚拟环境

uv venv --python 3.11

#激活虚拟环境（往下看，根据你的系统选择）
macOS / Linux：

bash

source .venv/bin/activate

Windows：

bash

.venv\Scripts\activate

激活成功后，终端行首会显示 (.venv) 字样。

步骤 4：安装 Browser Use（主流程）
bash
安装核心包（稳定版）

uv pip install browser-use

#安装 Playwright 浏览器驱动

uv pip install playwright

#安装 Chromium 浏览器（这一步需要联网，大约下载 300MB）
安装这个时，因为源默认是国外的，所以能翻墙的就翻墙，不能的多试几次，我就是多试了几次成功的。当然也可以换成国内的源，但是我装的时候，上一步安装的browser-use是组新版本，国内源还没有，所以只能用默认源。

playwright install chromium

Linux 用户建议执行 playwright install --with-deps，会自动安装 Chromium 依赖的系统级库。

如果想一次性安装所有可选功能（如视频录制、CLI 终端界面、云服务集成等），可以改为：

bash

uv pip install "browser-use[all]"

可选功能分组参考官方文档说明。这一步我没安装。

步骤 5：设置 API Key
Browser Use 本身是开源免费的，但调用 AI 模型需要 API Key。在项目根目录创建 .env 文件：

bash

创建 .env 文件（macOS/Linux）

touch .env

或用记事本/VS Code 直接创建 .env 文件

在 .env 里写入你的 API Key（任选一种即可）：

我用的：

# 指定模型为兼容 OpenAI 的模型
OPENAI_MODEL="qwen3.5-27b"

# 指定自定义的 API 地址 (这里以阿里云百炼平台为例)
OPENAI_BASE_URL="https://dashscope.aliyuncs.com/compatible-mode/v1"

# 填写你在阿里云百炼平台获取的 API Key
OPENAI_API_KEY="sk-XXXXXX3"

方案 A：DeepSeek（国内可用，价格实惠，强烈推荐）

text
DEEPSEEK_API_KEY=sk-xxxxxx你的密钥
方案 B：OpenAI

text
OPENAI_API_KEY=sk-xxxxxx你的密钥
方案 C：Browser Use Cloud（官方托管模式，附带 Stealth 浏览器）

text
BROWSER_USE_API_KEY=your-cloud-api-key
✅ 一份完整的 .env 文件可配置多个 Key，Browser Use 会自动识别。

五、验证安装（Hello World）
确认环境无误后，创建第一个脚本 hello.py：
这个脚本我没用到，你们自己试试，记得改成可用的模型。
python

import asyncio
from dotenv import load_dotenv
from langchain_openai import ChatOpenAI
from browser_use import Agent

load_dotenv()

async def main():
    # 初始化 LLM（以 OpenAI 为例）
    llm = ChatOpenAI(model="gpt-4o")
    
    # 创建 Agent
    agent = Agent(
        task="打开 GitHub，找到 browser-use/browser-use 仓库，告诉我 star 数量",
        llm=llm,
    )
    
    # 运行任务（max_steps 控制最大执行步骤数）
    await agent.run(max_steps=15)

if __name__ == "__main__":
    asyncio.run(main())

运行脚本：

bash

python hello.py

如果一切正常，你会看到 Agent 自动打开浏览器、搜索 GitHub、进入项目页面、读取数据，最后在终端输出 star 数量。

二、使用

让大模型写了个脚本，你们用的话，记得用自己配置的模型，从上述中.env读取的

import asyncio
import os
from dotenv import load_dotenv
# 使用 browser-use 官方封装的 ChatOpenAI 类
from browser_use.llm import ChatOpenAI
from browser_use import Agent, BrowserProfile, BrowserSession

load_dotenv()

async def main():
    # 1. 从环境变量读取 Qwen 配置，初始化 browser-use 的 LLM
    llm = ChatOpenAI(
        model=os.getenv("OPENAI_MODEL", "qwen3.5-27b"),
        base_url=os.getenv("OPENAI_BASE_URL", "https://dashscope.aliyuncs.com/compatible-mode/v1"),
        api_key=os.getenv("OPENAI_API_KEY"),
        temperature=0.7,
    )
    
    # 2. 配置浏览器（显示窗口，方便观察）
    browser_profile = BrowserProfile(headless=False)
    browser_session = BrowserSession(browser_profile=browser_profile)
    
    # 3. 创建 Agent
    agent = Agent(
        task="""
        1. 访问www.mooctest.net
        2. 测试登录功能，这是正确的用户名和密码：testuser\12345tttt@11
        3。如果有bug，整理成表格保存到我的电脑桌面
        """,
        llm=llm,
        browser_session=browser_session,
        use_vision=True,
    )
    
    # 4. 执行任务
    result = await agent.run(max_steps=25)
    print("抓取结果：")
    print(result)

if __name__ == "__main__":
    asyncio.run(main())

如下图，启动后，大模型会自己打开浏览器，打开网站，识别哪些是输入账号的，哪些是输入密码的，哪些是登录按钮，还可以要求他把发现的bug输出出来。还是有一定的作用的
在这里插入图片描述

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

开题报告基于SSM框架的ACG周边交易商城购物精品开题

AtomGit开源社区

从“解释世界“到“让事情发生“：AI时代最该升级的不是工具，而是你的思维操作系统

在复杂系统中，允许"有效但暂时不可解释"的结果先行发生，再通过快速迭代逼近理解。① 概率思维替代因果思维不再追问"为什么A导致B"，而是评估"如果做A，B发生的概率是多少"。AI输出的置信度分数，比人类的因果叙事更接近真实的不确定性。② 快速验证替代完美论证用最小成本让假设"发生"——一个MVP、一次A/B测试、一轮AI辅助的模拟推演。在行动中收集反馈，而非在论证中消耗机会窗口。③ 事后解释替代事

AtomGit开源社区

基于密集型复杂城市场景下求解无人机三维路径规划的Q-learning 算法研究（Matlab代码实现）

随着无人机在城市环境中应用的不断拓展，如物流配送、航拍测绘、交通监控等，其三维路径规划问题日益受到关注。密集型复杂城市场景具有障碍物密集、三维空间约束复杂、实时性要求高等特点，传统路径规划算法难以满足需求。Q-learning算法作为一种强化学习方法，具有无需环境模型、通过试错学习等优点，适合应用于此类场景。本文深入研究基于Q-learning算法的无人机三维路径规划方法，通过合理定义状态空间、动