Windows 和 Ubuntu 安装 WeKnora 全攻略
文章目录
【开场白】
前两期我们装了 OpenClaw 和 Hermes——一个是 AI 通信网关,一个是自进化智能体。但有个问题一直没解决:
你的文档怎么办?
产品手册、合同条款、技术文档、会议纪要……堆了几百个 PDF 和 Word,用的时候翻半天。通用 AI 问它一句,它给你编一段——看着靠谱,实际可能是瞎编的。
今天装的这个东西,专治"文档多、找不着、AI 胡说"——WeKnora,腾讯开源的文档理解与智能检索框架。
它只做一件事:你给它文档,它只从文档里找答案。不多说一句,不编一个字。
而且,它和你已经装好的 Hermes、OpenClaw 都不冲突——三个工具各有分工,我们后面讲。
【先搞清楚:WeKnora 是什么?】
一句话:本地部署的 RAG 知识库问答系统。
RAG,全叫 Retrieval-Augmented Generation,检索增强生成。听着玄乎,逻辑很简单:
传统大模型:你问 → 它凭训练数据答 → 可能编造(幻觉)
RAG 模式: 你问 → 先从你的文档里检索 → 把检索结果喂给模型 → 模型基于真实文档回答
区别就像:闭卷考试 vs 开卷考试。 WeKnora 让 AI 翻你的文档再回答,而不是凭记忆瞎编。
WeKnora 的核心能力:
| 能力 | 说明 |
|---|---|
| 深度文档解析 | PDF、Word、Markdown、HTML、图片——表格、公式、图文混排都能识别 |
| 混合检索 | 关键词 + 向量语义 + 知识图谱,三种检索策略协同,又准又全 |
| 零幻觉问答 | 答案 100% 来自你提供的文档,找不到就明说"未在文档中出现" |
| ReACT Agent | 支持联网搜索、调用工具、多轮推理,处理复杂任务 |
| 本地部署 | 数据不离开你的机器,金融、法律、医疗等敏感场景也能用 |
【安装方案:两种选一种】
WeKnora 提供两种安装方式,差别很大:
| 对比 | Docker 部署 | 一键镜像 |
|---|---|---|
| 适合谁 | 开发者、需要完整功能 | 新手、只想快速体验 |
| 需要装什么 | Docker + Docker Compose + Git | 什么都不用,下载即用 |
| 安装难度 | ⭐⭐ | ⭐ |
| 功能完整度 | 全功能(知识图谱、对象存储、监控) | 基础功能(文档问答、模型切换) |
| 可定制性 | 高(改 .env、换模型、加插件) | 低 |
| Windows 兼容 | Docker Desktop 或 WSL2 | 原生 .exe 双击运行 |
我的建议: 先用一键镜像体验,觉得值再切 Docker 部署上全功能。两个方案我都讲。
【方案一:一键镜像——5 分钟开箱即用】
这个方案最简单。不需要 Docker,不需要命令行,不需要懂什么是向量数据库。
Windows
- 下载:拿到
weknora-win-x64.exe - 双击运行——首次可能弹"未知发布者",点"仍要运行"(正常,本地打包的二进制没微软签名)
- 等 1-2 分钟——程序自动检测并安装 Ollama(约 80MB),下载默认模型 phi3:3.8b(约 2.1GB)
- 浏览器自动打开
http://localhost:8080,看到 🟢 Online 就成功了
端口 8080 被占用?关掉占用的程序再试。Windows 下查端口:
netstat -ano | findstr :8080 taskkill /PID <PID号> /F
Ubuntu
- 下载:拿到
weknora-linux-x64.bin - 终端执行:
chmod +x weknora-linux-x64.bin ./weknora-linux-x64.bin - 等 1-2 分钟——同上,自动装 Ollama + 模型
- 打开浏览器
http://localhost:8080,看到 🟢 Online 搞定
30 秒验证
界面打开后:
- 左侧"背景知识"框,粘贴:
WeKnora 是一款本地知识问答工具。它基于 Ollama 框架运行,无需联网即可使用。默认模型为 phi3:3.8b,适合快速响应和精准抽取。
- 右侧"你的问题"框,输入:
WeKnora 默认使用什么模型?
- 点"提问"——几秒后应出现:
WeKnora 默认使用的模型是 phi3:3.8b。
答案对、不编造、格式整洁——部署完成。 全程没碰终端,没改配置。
【方案二:Docker 部署——全功能生产级】
一键镜像够体验,但你要知识图谱、对象存储、多租户权限、监控日志——那得上 Docker。
Windows:4 步
第 1 步:装 Docker Desktop
官网下载安装,一路下一步。装完确保:
- 右下角小鲸鱼图标显示绿色
- Settings 里 “Use the WSL 2 based engine” 是勾选状态
没装 WSL2?管理员 PowerShell 执行
wsl --install,重启电脑。
第 2 步:装 Git for Windows
官网下载,安装时 “Adjusting your PATH environment” 那一步选 “Git from the command line and also from 3rd-party software”。
第 3 步:克隆仓库 + 配置
打开 PowerShell 或命令提示符:
mkdir C:\ai-projects
cd C:\ai-projects
git clone https://github.com/Tencent/WeKnora.git
cd WeKnora
cp .env.example .env
⚠️ 路径必须全英文!
C:\我的项目\WeKnora这种中文路径会导致 Docker 构建失败。
编辑 .env 文件,核心配置:
| 变量 | 说明 | 推荐值 |
|---|---|---|
LLM_PROVIDER |
大模型提供商 | openai(用 OpenAI 兼容接口) |
LLM_API_KEY |
API Key | 粘贴你的 Key |
LLM_BASE_URL |
API 地址 | 国内可用 DeepSeek/智谱的兼容接口 |
EMBEDDING_PROVIDER |
向量模型 | openai |
VECTOR_DB |
向量数据库 | qdrant(v0.2+ 推荐)或 pgvector |
第 4 步:启动
docker compose up -d
首次运行拉镜像,3-5 分钟。看到 Started 且光标回到新行——打开浏览器访问 http://localhost。
全功能模式(知识图谱 + 对象存储 + 监控):
docker compose --profile full up -d
Ubuntu:3 步
第 1 步:装 Docker
curl -fsSL https://get.docker.com | sh
sudo usermod -aG docker $USER
newgrp docker
第 2 步:克隆仓库 + 配置
git clone https://github.com/Tencent/WeKnora.git
cd WeKnora
cp .env.example .env
编辑 .env,配置 LLM Provider 和 API Key(同上表)。
第 3 步:启动
docker compose up -d
验证:
docker compose ps # 所有服务状态应为 running
curl http://localhost:8080/api/health # 返回 OK
打开 http://localhost,看到 WeKnora 界面——搞定。
【Docker 部署的 Profile 速查】
WeKnora 用 Docker Profile 按需开启功能,不用全装:
| 场景 | 命令 | 包含 |
|---|---|---|
| 最小部署 | docker compose up -d |
核心 API + Web UI + 数据库 |
| 全功能 | docker compose --profile full up -d |
核心 + 知识图谱 + 对象存储 + 监控 |
| 加知识图谱 | docker compose --profile neo4j up -d |
核心 + Neo4j 图数据库 |
| 加对象存储 | docker compose --profile minio up -d |
核心 + MinIO 对象存储 |
| 加可观测性 | docker compose --profile langfuse up -d |
核心 + Langfuse 追踪平台 |
按需选,不要一上来就 --profile full。 先跑通最小部署,再加功能。
【初始化:从"能打开"到"能干活"】
Docker 部署首次打开后,还有三步:
1. 创建管理员账号
首次访问 http://localhost,引导你注册管理员。
2. 配置模型
设置页面填入你的 LLM API Key。国内推荐:
- DeepSeek——便宜,中文好,API 兼容 OpenAI 格式
- 智谱 GLM-4——无需代理,按量计费
- 本地 Ollama——零成本,隐私最强,但需要 GPU
3. 创建知识库 & 导入文档
点"创建知识库",选类型:
- FAQ 知识库:适合问答对,客服场景
- 文档知识库:适合长文档,技术手册、合同、报告
然后上传文档——PDF、Word、Markdown 直接拖进去,WeKnora 自动解析、分块、向量化。
【踩坑急救包】
| 问题 | 原因 | 解法 |
|---|---|---|
| 端口 80 被占用 | IIS 或其他服务占着 | .env 里改 WEB_PORT=8080,然后 docker compose up -d |
| 端口 8080 被占用 | 一键镜像和 Docker 同时跑 | 关掉其中一个,或改端口 |
| Docker 拉镜像超时 | 国内网络访问 Docker Hub 慢 | 配 Docker 镜像加速器,或用 docker compose pull 先拉 |
| 模型加载失败 / 首次提问无响应 | Ollama 下载模型中断或磁盘不足 | 删除 ~/.ollama/models/blobs/ 重试,确保磁盘 > 2GB |
| 上传文档失败 | 对象存储未配置 | Docker 加 --profile minio,或 .env 设 STORAGE_BACKEND=local |
| LLM 调用超时 | API Key 无效或网络不通 | 检查 Key、检查代理设置,.env 调大 LLM_TIMEOUT |
| 中文路径报错 | Windows 路径含中文 | 移到全英文路径如 C:\ai-projects\WeKnora |
| 升级 | 想更新到新版 | git pull && docker compose down && docker compose up -d |
【和 Hermes / OpenClaw 怎么搭配?】
三个工具完全共存,数据隔离:
~/.openclaw/ ← OpenClaw 的家
~/.hermes/ ← Hermes 的家
~/WeKnora/ ← WeKnora 的家(Docker 数据在容器卷里)
推荐分工:
| 工具 | 定位 | 核心能力 | 适合场景 |
|---|---|---|---|
| OpenClaw | AI 通信网关 | 消息平台接入、7×24 守护进程 | 飞书/钉钉机器人、团队 AI 助手 |
| Hermes | AI 自进化智能体 | 技能沉淀、持久记忆、多工具并行 | 代码审查、自动化流程、越用越强 |
| WeKnora | AI 知识库引擎 | 文档解析、混合检索、零幻觉问答 | 合同检索、技术文档查询、企业知识管理 |
一个组合场景:
- OpenClaw 接飞书,收到同事的问题
- 问题需要查文档?OpenClaw 调 WeKnora 的 API 做检索
- 检索结果需要深度分析?Hermes 接过做推理和技能沉淀
三件套:通信 + 进化 + 知识,覆盖 AI Agent 的核心需求。
【模型选择:本地 vs 云端】
WeKnora 支持多种模型接入方式:
| 方式 | 成本 | 隐私 | 效果 | 适合 |
|---|---|---|---|---|
| Ollama 本地(phi3/gemma2/qwen) | 零 | 最强 | 中等 | 个人体验、敏感文档 |
| DeepSeek API | 极低 | 中 | 强 | 性价比首选 |
| 智谱 GLM-4 | 低 | 中 | 强 | 国内无代理 |
| Claude / GPT-4 | 高 | 弱 | 最强 | 效果优先、非敏感数据 |
我的建议: 本地体验用 Ollama,生产部署用 DeepSeek 或智谱。省钱又省心。
【一图流总结】
方案一:一键镜像(5分钟体验)
Windows: 下载 .exe → 双击 → 等 2 分钟 → 打开 localhost:8080
Ubuntu: 下载 .bin → chmod +x → 运行 → 打开 localhost:8080
方案二:Docker 部署(10分钟全功能)
Windows: Docker Desktop → git clone → cp .env.example .env → docker compose up -d
Ubuntu: 装 Docker → git clone → cp .env.example .env → docker compose up -d
验证:
方案一:粘贴文本 → 提问 → 答案准确 = 成功
方案二:curl localhost:8080/api/health → OK = 成功
【结尾】
WeKnora 的价值,不在于它多炫酷,在于它解决了一个真实的痛点——文档就在那里,但找起来太费劲,AI 帮你找又不靠谱。
WeKnora 让 AI 只说文档里有的话。找不到就老实说"没找到",不会编一个"看着对但其实不对"的答案。
对于合同审核、技术文档查询、产品参数检索这种答错比不答更危险的场景,这才是正确的 AI 姿势。
装完 OpenClaw + Hermes + WeKnora,你的本地 AI 工具链就完整了——通信、进化、知识,三位一体。
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐


所有评论(0)