桌面 AI 助手 OpenHuman 实测：3 个月 17.5k stars，记忆系统是亮点

SOC罗三炮

570人浏览 · 2026-05-19 22:57:36

SOC罗三炮 · 2026-05-19 22:57:36 发布

OpenHuman 是一个开源桌面 AI 助手，GitHub 地址是 tinyhumansai/openhuman。2026 年 2 月发布，现在 17.5k stars。我用一个下午翻了它的源码和文档，下面是我的调研结果。

它解决什么问题

AI 模型本身没有记忆。你敲一段 prompt，得到一段回复，上下文就没了。即使带"记忆"功能的，存的也不过是几个要点。

OpenHuman 想解决的是：让 AI 真正知道你的事，而不是每个会话从头猜。

它的做法是：把所有能接的数据源（Gmail、Slack、GitHub、Notion……）接入后，走一条确定的管道——转成 Markdown → 切成 ≤3k tokens 的块 → 打分 → 按源/主题/天维度归纳成摘要树。全部存在本地 SQLite 里。

技术栈

层	技术
核心逻辑	Rust（15.5 MB 代码）
桌面壳	Tauri v2 + Chromium Embedded Framework (CEF)
前端	React + TypeScript + Vite + Tailwind
前端包管理	pnpm
本地 AI	Ollama / LM Studio
云 AI	Anthropic、OpenAI、Google、Groq 等 30+ 提供商
集成网关	Composio（118+ 第三方服务）
数据库	SQLite + FTS5 全文搜索 + 向量嵌入 + 知识图谱
许可证	GPL-3.0

桌面壳（Tauri）内置了 Chromium 渲染引擎（CEF），不依赖系统浏览器。这个设计让它可以：

用 CDP（Chrome DevTools Protocol）控制网页
注入脚本来操作 Discord / Slack / Telegram 等网页版
在 Google Meet 里以真实参与者身份接入（有虚拟摄像头和虚拟麦克风）

核心功能

记忆树（Memory Tree）

这是 OpenHuman 最有差异化的功能。架构如下：

数据源 → 标准化 Markdown → ≤3k-token 分块 → 多维评分 →
  每源摘要树 → 每主题摘要树 → 每日全局摘要 → SQLite 存储
  同时生成 Obsidian 兼容 .md 文件

评分信号包括：交互频率、源权重、token 数量、唯一性。不依赖纯向量搜索，而是结构化分级摘要。官方说法是"最多 10 亿 tokens"的记忆容量。

每 20 分钟后台自动抓取一次已连接的数据源，新内容自动进入管道。

桌面角色（Mascot）

一个在桌面上显示的角色，有面部表情，能说话，会对环境做反应。它能：

语音对话（Native TTS/STT）
以真实参与者身份加入 Google Meet（有自己的画面和声音）
在后台持续思考（Subconscious Loop）
关掉 App 窗口后仍然运行

从代码看，实现了虚拟摄像头注入、音频桥接、字幕监听、主动发言，一套完整的会议交互管道。

118+ 第三方集成

通过 Composio 网关做 OAuth 一键连接。在代码里看到了 Gmail、Slack、Discord、Telegram、WhatsApp、Google Calendar、Google Drive、GitHub、Notion、Linear、Jira、Stripe 等。

每个集成暴露为类型化的工具，有单独的触发器（比如新邮件自动触发摘要）。

模型路由

根据任务类型自动选择模型：

提示前缀	用途
`hint:reasoning`	多步推理、规划
`hint:agentic`	通用 Agent 任务
`hint:coding`	代码生成
`hint:summarization`	摘要、轻量任务

路由表可以在运行时修改，不用重启核心进程。

原生工具

以下工具开箱就有，不需要额外配置：

Web 搜索 + 网页内容抓取
代码编辑（读文件、写文件、补丁、全文搜索、Git 命令）
浏览器控制 + 桌面控制（CDP + 截图）
Cron 定时任务
子代理调度（派生子任务、并行 agent）
记忆工具（存储/召回/遗忘）
TTS 语音输出
MCP 客户端 + MCP 服务器

智能 Token 压缩（TokenJuice）

代码里有一个独立的 tokenjuice 模块，实现了智能压缩，降低推理成本。

价格

从代码看，OpenHuman 使用 Stripe 订阅制 + 信用点充值：

有计划层级：pro、enterprise
支持信用点按需充值（top-up）
支持自动充值（auto-recharge）
支持优惠券兑换

具体价格在后端服务里，不在开源代码中。官网主页只说 “One Subscription. That’s it.”

架构特点

核心逻辑（Rust）以进程内任务（tokio task）运行在 Tauri 壳里，前后端通过 HTTP JSON-RPC 通信，端口随机分配，请求头带单次启动的 Bearer Token。

没有独立的后端侧车进程（sidecar），前端关了核心也关了。核心功能通过 RPC 暴露给前端，前端只负责展示和交互编排。

安装方式

# macOS / Linux
curl -fsSL https://raw.githubusercontent.com/tinyhumansai/openhuman/main/scripts/install.sh | bash

# Windows
irm https://raw.githubusercontent.com/tinyhumansai/openhuman/main/scripts/install.ps1 | iex

也可以在官网 tinyhumans.ai/openhuman 下载 DMG / EXE。

与 Hermes Agent 的对比

下面从几个关键维度看两者的差异和各自的定位。

形态与使用场景

	OpenHuman	Hermes Agent
形态	桌面 GUI App（Tauri）	CLI + TUI + 消息平台网关
适用场景	个人桌面助手、“私人 AI 超级智能”	开发、运维、自动化、多平台消息
安装	下载安装包 / 一行脚本	`pip install hermes-agent` / 安装脚本
启动	点图标开 App	终端敲 `hermes`

OpenHuman 是桌面 App——你安装完、登录、接上数据源，它就一直在后台跑着，桌面有个角色时不时看一下。Hermes Agent 是终端工具——你要用就敲命令，也可以用网关挂在 Telegram/Discord/飞书上。

技术栈与本地模型支持

	OpenHuman	Hermes Agent
核心语言	Rust（15.5 MB 代码）	Python
UI 形态	Tauri v2 + CEF（桌面壳）	Rich TUI（prompt_toolkit）
数据存储	SQLite + FTS5 + 向量 + 图	SQLite + agentmemory / Honcho / Mem0
云模型	Anthropic / OpenAI / Google / Groq 等 30+	20+ 提供商 + 自定义端点
本地推理	Ollama / LM Studio（限制多：MVP 只允许 gemma3:1b）	Ollama / vLLM / GGUF（无限制）

记忆系统

	OpenHuman	Hermes Agent
记忆架构	Memory Tree：分块→评分→分级摘要→SQLite	agentmemory：BM25 + 向量 + 知识图谱（可选）
记忆容量	“最多 10 亿 tokens”	取决于后端配置
本地存储	SQLite + 文件系统	SQLite / agentmemory 服务
Obsidian 集成	原生支持（自动生成 .md 文件）	无原生支持

OpenHuman 的记忆系统设计更精细——分块→评分→分级摘要这条管道有完整的文档和代码。Hermes 相比之下更灵活，可以接不同的后端（agentmemory、Honcho、Mem0）。

集成能力

	OpenHuman	Hermes Agent
集成方式	Composio 一键 OAuth（118+）	MCP 协议（stdio / HTTP）
消息平台	无（桌面 App，不接 IM）	Telegram / Discord / Slack / 飞书 / 微信 / 钉钉 / Email / SMS / Signal / Matrix……
MCP 协议	内置 MCP 客户端 + 服务器	原生 MCP 客户端 + MCP 服务端模式
手动配置	有（Composio 也支持手动）	需要手动配 API key / MCP 服务器

Hermes Agent 的核心优势之一是多消息平台网关——写一篇文章，可以让它同时发布到 CSDN、微信公众号，再通知到 Telegram。OpenHuman 是桌面 App，不做消息平台对接。

工具与 Agent 系统

	OpenHuman	Hermes Agent
浏览器控制	✅ CDP + 截图	✅ Browserbase / Camofox / 本地 Chromium
电脑控制	✅ 桌面截图	✅ cua-driver（macOS）
代码编辑	✅ 读/写/补丁/搜索/Git	✅ 读/写/补丁/搜索/Git
子代理	✅ spawn_subagent / spawn_parallel	✅ delegate_task
Cron	✅ 内置	✅ 内置（带脚本/通知/链式）
会议参与	✅ Google Meet（有画面有声音）	❌
Agent 数量	十几个预置子 Agent	按需触发 + 子代理调度
后台思考	Subconscious Loop（持续后台）	无（按需执行）
技能系统	技能注册表（ops_install/ops_create）	技能 Skills（SKILL.md 格式，hub 安装）

OpenHuman 预置了十几个专用子 Agent，每个有独立的 prompt 和工具集，通过调度器分发：

研究员（researcher）
程序员（coder）
代码审查（code_reviewer）
摘要（summarizer）
工具制造（tool_maker）
触发响应（trigger_reactor / trigger_triage）
技能创建（skill_creator）
欢迎引导（welcome）
等等

每个子 Agent 有独立的 prompt 和工具集，通过调度器分发任务。

总结

看中什么	选哪个
桌面 App、开机即用、有个"AI 伙伴"的感觉	OpenHuman
终端里搞开发、写代码、自动发布	Hermes Agent
多消息平台（TG/飞书/微信/钉钉）	Hermes Agent
本地数据隐私优先	两者都支持，OpenHuman 更彻底（全本地 SQLite）
需要接 100+ 第三方服务	两者各有方案
需要 AI 参与视频会议	OpenHuman（独有）
需要 CI/CD 和自动化集成	Hermes Agent

OpenHuman 定位是个人桌面 AI 助手，让你电脑上跑一个始终在线、认识你的 AI。Hermes Agent 定位是开发者和效率工具，适合终端重度用户和多平台自动化场景。

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

无 Root 权限搞定！远程服务器配置 Claude Code 中转教程（终端/插件）

AtomGit开源社区

微信二次开发的微信机器人为什么不能只做自动回复？

AtomGit开源社区

After Effects (AE)2026超详细保姆级下载安装教程附软件功能详解（新手零基础适用）

这次2026版本直接把3D功能拉满了，内置了立方体、球体这些基础的参数化模型，还支持Substance 3D材质，灯光能投射阴影，渲染出来的效果和专业3D软件几乎没差别。我试了一下，用它抠一个带半透明效果的logo，一键就能搞定，效果比以前手动调参数自然多了。以前预览视频的时候，生成的临时文件占了我好大一块硬盘空间。我用它预览了一个5分钟的动画，生成的临时文件只有以前的十分之一大小，再也不用频繁清