阅读来源:如何开发浏览器 AI 助手插件 —— 一键总结任意网页

一、核心定位:AI 辅助的浏览器插件开发

这套方案用 Vibe Coding 模式,帮你用 AI 辅助,完整走完 Chrome 浏览器 AI 插件从 0 到 1 的开发闭环:从零开发一个能一键总结任意网页的 AI 插件,全程靠自然语言和 AI 沟通,不用死记硬背插件 API,就能快速给浏览器装上「超能力」。
在这个模式下,开发者的角色从「代码撰写者」转变为「产品架构师」:

  • 你:负责描述需求、设计功能、验收效果

  • AI:负责把自然语言需求转化为插件代码,处理 Manifest V3 这些底层细节

  • Chrome:负责运行插件、提供系统 API 能力

二、Chrome 插件的核心架构

Chrome 插件基于 Manifest V3 标准,由几个核心组件协同工作:

组件 角色 作用
Manifest 文件 插件的身份证 声明插件的名称、权限、入口文件,告诉浏览器插件的基本信息
Service Worker 后台大脑 在后台处理事件、调用 API,按需启动,不常驻内存
Content Script 页面眼睛 注入到网页中,读取页面的 DOM 内容
Side Panel 交互界面 在浏览器右侧展示 UI,用户在这里查看 AI 总结结果
Options Page 设置页面 让用户配置 API Key 等参数

它们的协作流程:
用户点击插件图标 → 侧边栏打开 → 用户点击总结按钮 → 侧边栏通知 Service Worker → Service Worker 让 Content Script 读取页面文字 → Content Script 返回内容 → Service Worker 调用 AI API → AI 返回摘要 → Service Worker 把结果发回侧边栏展示

三、两种 AI 方案对比

插件有两种获取 AI 总结能力的方式,可根据需求选择:

方案 优点 缺点 适用场景
云端 API(OpenAI/Claude) 模型能力强,支持所有设备 需要 API Key,有使用成本,需要联网 追求高质量摘要、处理复杂内容
Chrome 内置 AI 免费、隐私安全、无需 API Key、本地运行 需要 Chrome 138+,硬件要求较高,模型能力有限 注重隐私、不想付费、硬件条件允许

四、开发环境与项目初始化

4.1 工具准备

  • Chrome 浏览器(138+ 版本,支持内置 AI)

  • AI 编程助手(Cursor/Trae/Claude Code)

  • 可选:OpenAI 或 Claude 的 API Key

4.2 项目骨架搭建

  1. 创建项目结构:给 AI 下指令,让它生成完整的 Manifest V3 项目结构,包括所有需要的文件

  2. Manifest 配置:配置插件的权限,包括 storage、activeTab、scripting、sidePanel,声明各个组件的入口

  3. 准备图标:让 AI 生成 16x16、48x48、128x128 三个尺寸的插件图标

  4. 加载插件:在 Chrome 的扩展页面开启开发者模式,加载已解压的插件文件夹,后续修改后刷新即可更新

五、AI 迭代开发流程

用自然语言和 AI 协作,逐个实现各个组件:

5.1 Content Script 开发

让 AI 编写内容脚本,实现读取页面文字的功能,监听来自后台的消息,提取页面的标题、URL 和文字内容。

5.2 Service Worker 开发

让 AI 编写后台脚本,实现组件间的通信,以及调用云端 AI API 的逻辑,协调各个组件的工作流程。

5.3 侧边栏 UI 开发

让 AI 编写侧边栏的 HTML、CSS 和 JS,实现用户交互界面,包括总结按钮、加载动画、结果展示、复制功能。

5.4 设置页面开发

让 AI 编写设置页面,实现 AI 提供商选择、API Key 输入和保存的功能,把配置存在本地存储中。

六、Chrome 内置 AI 接入

如果你的浏览器支持,可以接入免费的本地 AI 能力:

  1. 检查支持情况:确认浏览器版本、硬件条件,开启对应的 flags 开关

  2. Summarizer API:让 AI 帮你添加内置 AI 的支持,检查可用性,调用本地的总结 API,完全不用联网和 API Key

  3. 更新设置:在设置页添加内置 AI 的选项,选择时隐藏 API Key 输入框

七、测试与调试

7.1 本地调试方法

Chrome 插件的调试和普通网页不同,各个组件有独立的调试入口:

  • 调试 Service Worker:在扩展页面点击插件的 Service Worker 链接,打开独立的 DevTools

  • 调试侧边栏:右键侧边栏内容,选择检查,打开侧边栏的 DevTools

  • 调试 Content Script:在页面的 DevTools 中,切换到插件的上下文,查看输出

7.2 常见问题排查

问题 可能原因 解决方法
点击图标没反应 Service Worker 报错 检查后台脚本的 DevTools 控制台
获取不到页面内容 Content Script 未注入 刷新页面,检查 manifest 配置
API 调用失败 API Key 错误 在设置页重新输入正确的 Key
侧边栏空白 路径配置错误 检查 manifest 中的侧边栏路径

八、发布到 Chrome Web Store

如果要分享给他人使用,可以发布到应用商店:

  1. 准备工作:注册开发者账号,一次性 5 美元注册费,开启两步验证,准备图标、截图、描述、隐私政策

  2. 打包上传:把项目打包为 zip 文件,在开发者后台上传,填写商店信息,提交审核

  3. 审核:Google 会审核插件,权限越少、描述越清晰,审核通过越快

九、总结

浏览器插件是一个非常灵活的开发领域,它能给任意网页增强能力,这个开发流程可以复用在任何插件开发中:

  • 翻译助手:一键翻译外文网页

  • 阅读标注:在网页上高亮批注

  • 价格追踪:监控商品价格变化

  • 代码解释:自动解释 GitHub 代码

Chrome 内置 AI 的出现更是降低了门槛,你甚至不需要 API Key 就能构建 AI 驱动的插件。你只需要把精力放在「做什么」上,剩下的技术细节交给 AI 就好,快速给你的浏览器装上专属的超能力。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐