目录

浏览器自动化推荐

浏览器自动化,即:OpenClaw 可以像人一样自动地操作浏览器,并且根据自动化程序分为 4 个等级:

  • L0:搜索 + 抓取。用 Brave Search 搜索,用 jina.ai 抓取页面内容,完全不需要浏览器。日常 80% 的信息获取靠这一层就够了。
  • L1:无头浏览器(Headless Chrome)。Headless 的意思是没有界面,浏览器在后台默默运行。适合那些需要加载 JavaScript 才能显示内容的页面。比如有些网站用 React 或 Vue 写的,不运行 JS 就是一片空白,这时候 L0 的抓取就失效了,需要 L1 来处理。
  • L2:有头浏览器 + DOM 操作。跟人类平时打开浏览器一样,有完整的界面。AI 通过获取网页上的 DOM 元素(DOM 就是网页的结构,按钮、输入框、链接这些都是 DOM 元素)来点击、输入、操作。适合需要登录、填表单、点按钮的场景。比如让 OpenClaw 登录某个网站,它会找到用户名输入框、密码输入框,依次填入,然后点击登录按钮。
  • L3:截图 + 视觉识别。有些信息只存在于图片里,比如商品图、参数表、图表,DOM 里根本拿不到这些信息。这时候让 AI 截图,然后用大模型的视觉能力识别图片内容。这是最后一层兜底方案,速度最慢,但能处理 L2 搞不定的情况。

如果你采用云主机部署,默认就是没有桌面环境的,所以 L2 和 L3 需要先装一个 Linux 桌面服务。

Brave Search(联网搜索)

OpenClaw 官方内置的联网搜索功能由 Brave Search 提供,注册账户后,每个月有 2000 次免费搜索额度,日常够用了。注意,要先注册 Brave 账号,然后绑一张海外 Visa 卡。或者上闲鱼搜 Brave Search API,花几十块买一个。

装了之后 OpenClaw 能上网查资料、搜新闻、找答案。前提是需要申请一个免费的 Brave Search API key。到 brave.com/search/api 申请 key,选 Data for Search 计划。

clawhub install brave-search

浏览器操作

Agent Browser 项目也可以让 OpenClaw 打开浏览器、登录后台、抓网页信息、填表单、截图、导 PDF。

clawhub install browser

网页抓取

jina.ai Reader 用于联网搜索到结果之后,还能打开链接、读取网页内容。并且它不用打开浏览器,用法极其简单:在任何网址前面加上 https://r.jina.ai/ 这个前缀就行。

比如想抓取 https://example.com/article 的内容,只需要访问 https://r.jina.ai/https://example.com/article,它就会返回干净的 AI 友好的 Markdown 格式内容。

  1. 返回的内容是干净的 Markdown 格式,AI 读起来很舒服
  2. 免费,不需要 API key,直接用

KasmVNC 远程桌面

OpenClaw 在操作浏览器的时候,经常会遇到验证码、二维码、滑块验证等验证。如果你采用云主机,这种时候你就需要远程桌面来进行人机协同。

KasmVNC 就是一个通过 VNC 协议的、基于网页的远程桌面服务,装上之后,你可以通过自己电脑的浏览器远程连接到云主机的桌面,直接看到 OpenClaw 正在操作的浏览器画面。需要的时候接管鼠标键盘,帮它过验证码,过完之后把控制权还给它,它继续干活。

browser CLI

OpenClaw 内置了浏览器控制能力,AI 可以像人类一样操作网页。

# 查看浏览器状态
openclaw browser status

# 启动浏览器
openclaw browser start

# 打开网页
openclaw browser open https://example.com

# 截图
openclaw browser screenshot

# 获取页面快照(用于 AI 理解页面结构)
openclaw browser snapshot --format aria

# 创建多个浏览器配置
openclaw browser create-profile --name "work" --color "#3b82f6"
openclaw browser create-profile --name "personal" --color "#10b981"
# 切换使用不同的配置文件
openclaw browser start --browser-profile "work"

应用技巧

使用 Claude Code 对 OpenClaw 进行运维

OpenClaw 做业务工作,Claude Code 做 OpenClaw 的安全运维操作。这两个工具是互补的,避免 OpenClaw 把自己摧毁。

手机上安装 HappyCoder 就可以让你通过手机连接到云主机上的 Claude Code。

对 OpenClaw 进行入职培训

针对个人需求,如果有一些人性化强文本物料的话,可以把这些文本物料喂给 OpenClaw,使其根据这些物料来更新 SOUL.md,让 OpenClaw 更懂你的性格、需求和工作模式。

开启 steer 模式

默认情况下,AI 在处理当前消息时,你发的新消息会排队等着,等它回复完了再处理。这就导致一个问题:如果它正在执行一个很长的任务(比如搜索十个网页),你中途想让它换个方向,只能干等它做完。

改成 steer 模式后,你发的新消息会实时注入到 AI 正在处理的任务中,它会立刻调整方向,不用干等。

{
  "messages": {
    "queue": {
      "mode": "steer"
    }
  }
}
Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐