本地 DeepSeek + Page Assist:让 AI 读懂任意网页的完整指南
Tags: AI 本地部署 Ollama Page Assist Firefox LLM DeepSeek RAG
目录
环境说明
安装 Page Assist 插件
配置连接本地 Ollama
网页内容注入功能使用
进阶:启用 RAG 知识库
常见问题排查
环境说明
项目 版本/要求
操作系统 Windows 10/11
浏览器 Firefox(必须,Chrome 版功能有差异)
Ollama v0.2+
推荐模型 qwen2.5:7b / deepseek-r1:8b
嵌入模型(可选) nomic-embed-text(启用 RAG 时需要)
前置条件:本教程假设已完成 Ollama 安装和模型拉取。若未完成,请参考上一篇教程:手把手教你:在电脑上免费安装本地 DeepSeek
安装 Page Assist 插件
方式一:从 Firefox 插件商店安装(推荐)
Firefox 地址栏访问:
https://addons.mozilla.org/firefox/addon/page-assist/
点击 「+ 添加到 Firefox」,在弹出的权限确认窗口点「添加」。
安装成功后工具栏出现 Page Assist 图标(若不可见,点右上角「拼图图标」→「图钉」固定到工具栏)。
配置连接本地 Ollama
第一步:确认 Ollama 服务正在运行
打开终端,执行:
ollama list
看到模型列表说明服务正常运行。若报错,先启动服务:
ollama serve
第二步:在插件中填写 Ollama 服务地址
点击 Firefox 工具栏的 Page Assist 图标
进入左下角 「设置」(齿轮图标)
找到 「Ollama URL」 字段,填入:
http://localhost:11434
保存设置
注意:若修改过 Ollama 监听端口,此处需对应修改。
第三步:选择模型
界面顶部下拉菜单会自动枚举本地可用模型。
各模型对比:
模型 参数量 适用场景 CPU 速度参考
qwen2.5:3b 3B 快速问答、摘要 快(1-2 min/1000字)
qwen2.5:7b 7B 通用场景,质量均衡 中等(3-5 min/1000字)
deepseek-r1:8b 8B 复杂推理任务 慢(5-8 min/1000字)
网页内容注入功能使用
这是 Page Assist 的核心功能,实现思路是将当前网页文本作为上下文注入 Prompt。
操作步骤
打开目标网页
点击工具栏 Page Assist 图标,打开侧边栏
对话框底部点击 「当前页面」图标(文档样式按钮)
图标变为激活状态后,输入问题
示例 Prompt
请用三点总结这篇文章的核心内容
这篇文章中作者对 XX 问题的核心观点是什么?
把这个页面的英文内容翻译成中文
这段代码的作用是什么?帮我逐行解释
原理说明
Page Assist 通过 DOM 抓取当前页面可见文本,将其拼接到对话 Prompt 的 system 或 user 段,再提交给本地 Ollama API(POST http://localhost:11434/api/chat)。
全程数据在本地流转,不经过任何外部网络。
进阶:启用 RAG 知识库
Page Assist 支持向量化本地文档,实现基于文档内容的问答(RAG,Retrieval-Augmented Generation)。
第一步:拉取嵌入模型
ollama pull nomic-embed-text
模型大小约 274MB,等待下载完成。
第二步:配置嵌入模型
Page Assist 设置 → 「RAG 设置」 → 嵌入模型选择 nomic-embed-text → 保存。
第三步:创建知识库并上传文档
设置 → 「知识库」 → 新建 → 上传文档(支持 .txt、.pdf、.docx 等格式)。
使用知识库
在对话界面顶部选择知识库,之后的问答会优先基于知识库内容检索。
注意:当选中知识库时,AI 只会基于知识库内容回答,超出范围的问题可能无法回答。需要自由对话时记得取消选中知识库。
常见问题排查
Q1:模型列表为空
# 检查 Ollama 运行状态
ollama list
# 若无输出,手动启动服务
ollama serve
Q2:AI 回答"无法获取网页内容"
部分网页存在反爬虫机制(如动态渲染、CSP 限制),Page Assist 可能无法提取文本。可以尝试: - 换用普通静态网页测试 - 手动复制网页内容粘贴到对话框
Q3:响应速度极慢
CPU 设备上的推理速度受制于硬件,可以: - 换用更小的模型(qwen2.5:3b) - 在 Ollama 启动参数中设置并发数:OLLAMA_NUM_PARALLEL=1
Q4:插件图标消失
Firefox 工具栏右侧点「拼图图标」→ 找到 Page Assist → 点「图钉」固定。
总结
Page Assist 是本地 LLM 生态中连接"模型能力"与"日常浏览器使用"的关键一环。配置完成后,Ollama 上运行的任何模型都可以通过它无缝介入你的网页浏览场景。
下一步推荐: - Open WebUI 安装指南:完整的 ChatGPT 风格前端,适合长对话和多轮交互 - nomic-embed-text 深入使用:RAG 知识库进阶配置
如有问题欢迎在评论区留言,关注作者可获取后续更新教程。
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐

所有评论(0)