本地 DeepSeek + Page Assist：让 AI 读懂任意网页的完整指南

Ai_easygo

149人浏览 · 2026-06-11 09:03:23

Ai_easygo · 2026-06-11 09:03:23 发布

Tags： AI 本地部署 Ollama Page Assist Firefox LLM DeepSeek RAG

目录
环境说明
安装 Page Assist 插件
配置连接本地 Ollama
网页内容注入功能使用
进阶：启用 RAG 知识库
常见问题排查
环境说明
项目   版本/要求
操作系统   Windows 10/11
浏览器   Firefox（必须，Chrome 版功能有差异）
Ollama   v0.2+
推荐模型   qwen2.5:7b / deepseek-r1:8b
嵌入模型（可选）   nomic-embed-text（启用 RAG 时需要）
前置条件：本教程假设已完成 Ollama 安装和模型拉取。若未完成，请参考上一篇教程：手把手教你：在电脑上免费安装本地 DeepSeek

安装 Page Assist 插件
方式一：从 Firefox 插件商店安装（推荐）
Firefox 地址栏访问：

https://addons.mozilla.org/firefox/addon/page-assist/
点击「+ 添加到 Firefox」，在弹出的权限确认窗口点「添加」。

安装成功后工具栏出现 Page Assist 图标（若不可见，点右上角「拼图图标」→「图钉」固定到工具栏）。

配置连接本地 Ollama
第一步：确认 Ollama 服务正在运行
打开终端，执行：

ollama list
看到模型列表说明服务正常运行。若报错，先启动服务：

ollama serve
第二步：在插件中填写 Ollama 服务地址
点击 Firefox 工具栏的 Page Assist 图标
进入左下角「设置」（齿轮图标）
找到「Ollama URL」字段，填入：
http://localhost:11434
保存设置
注意：若修改过 Ollama 监听端口，此处需对应修改。

第三步：选择模型
界面顶部下拉菜单会自动枚举本地可用模型。

各模型对比：

模型   参数量   适用场景   CPU 速度参考
qwen2.5:3b   3B   快速问答、摘要   快（1-2 min/1000字）
qwen2.5:7b   7B   通用场景，质量均衡   中等（3-5 min/1000字）
deepseek-r1:8b   8B   复杂推理任务   慢（5-8 min/1000字）
网页内容注入功能使用
这是 Page Assist 的核心功能，实现思路是将当前网页文本作为上下文注入 Prompt。

操作步骤
打开目标网页
点击工具栏 Page Assist 图标，打开侧边栏
对话框底部点击「当前页面」图标（文档样式按钮）
图标变为激活状态后，输入问题
示例 Prompt
请用三点总结这篇文章的核心内容
这篇文章中作者对 XX 问题的核心观点是什么？
把这个页面的英文内容翻译成中文
这段代码的作用是什么？帮我逐行解释
原理说明
Page Assist 通过 DOM 抓取当前页面可见文本，将其拼接到对话 Prompt 的 system 或 user 段，再提交给本地 Ollama API（POST http://localhost:11434/api/chat）。

全程数据在本地流转，不经过任何外部网络。

进阶：启用 RAG 知识库
Page Assist 支持向量化本地文档，实现基于文档内容的问答（RAG，Retrieval-Augmented Generation）。

第一步：拉取嵌入模型
ollama pull nomic-embed-text
模型大小约 274MB，等待下载完成。

第二步：配置嵌入模型
Page Assist 设置 → 「RAG 设置」 → 嵌入模型选择 nomic-embed-text → 保存。

第三步：创建知识库并上传文档
设置 → 「知识库」 → 新建 → 上传文档（支持 .txt、.pdf、.docx 等格式）。

使用知识库
在对话界面顶部选择知识库，之后的问答会优先基于知识库内容检索。

注意：当选中知识库时，AI 只会基于知识库内容回答，超出范围的问题可能无法回答。需要自由对话时记得取消选中知识库。

常见问题排查
Q1：模型列表为空

# 检查 Ollama 运行状态
ollama list

# 若无输出，手动启动服务
ollama serve
Q2：AI 回答"无法获取网页内容"

部分网页存在反爬虫机制（如动态渲染、CSP 限制），Page Assist 可能无法提取文本。可以尝试： - 换用普通静态网页测试 - 手动复制网页内容粘贴到对话框

Q3：响应速度极慢

CPU 设备上的推理速度受制于硬件，可以： - 换用更小的模型（qwen2.5:3b） - 在 Ollama 启动参数中设置并发数：OLLAMA_NUM_PARALLEL=1

Q4：插件图标消失

Firefox 工具栏右侧点「拼图图标」→ 找到 Page Assist → 点「图钉」固定。

总结
Page Assist 是本地 LLM 生态中连接"模型能力"与"日常浏览器使用"的关键一环。配置完成后，Ollama 上运行的任何模型都可以通过它无缝介入你的网页浏览场景。

下一步推荐： - Open WebUI 安装指南：完整的 ChatGPT 风格前端，适合长对话和多轮交互 - nomic-embed-text 深入使用：RAG 知识库进阶配置

如有问题欢迎在评论区留言，关注作者可获取后续更新教程。

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

RDK X5 从零上手：烧录系统镜像 + Wi-Fi 配网 + SSH 远程登录完整教程

摘要：本文提供RDK X5开发板从零开始的完整环境搭建指南，覆盖系统镜像选择（Server/Desktop版）、使用RDK Studio或Rufus工具烧录Micro SD卡、通过115200波特率串口首次登录、命令行/Wi-Fi配网（nmcli/srpi-config）、SSH远程连接等关键步骤。特别强调必须使用5V/5A电源适配器，避免USB供电不足导致重启。教程包含硬件清单、详细操作命令和常

AtomGit开源社区

基于SpringBoot+Vue的火锅店管理系统管理系统设计与实现【Java+MySQL+MyBatis完整源码】

AtomGit开源社区

Java开发工具指南：提高开发效率的利器

Maven 采用约定优于配置的原则，通过 pom.xml 文件定义项目的结构和依赖关系，简化了项目的构建过程。IntelliJ IDEA 是由 JetBrains 公司开发的一款功能全面的 Java 集成开发环境（IDE），被广泛认为是目前最优秀的 Java IDE 之一。例如，通过安装 Mylyn 插件，可以实现任务导向的开发，提高工作效率；它支持多种语言和框架，通过插件可以实现代码补全、调试、