GitHub 85K Star 新王挑战 357K Star 霸主：Hermes 还是 OpenClaw？最强Agent框架怎么选

巴朗唐

597人浏览 · 2026-04-15 22:02:34

巴朗唐 · 2026-04-15 22:02:34 发布

前言

2025年，大模型爱好者的烦恼，是AI Agent框架的“百花齐放，却难称心”——LangChain 略显笨重，AutoGen 过于复杂，LlamaIndex 又偏重检索……选型，成了一个令人纠结的难题。

到了2026年，局面变了。强大的AI Agent框架层出不穷，甜蜜的烦恼升级为：这么多强者，到底该选谁？

就在大家还在争论时，OpenClaw（那只“小龙虾”）横空出世，凭借极简的操作和强大的执行力，掀起了一股“全民养虾”的热潮。可最近，另一个名字 Hermes Agent 被反复提及。截至4月15日，它在GitHub上已斩获 85k Star，大有新王登基之势，有的大模型爱好者甚至喊出口号：“爱马仕买不起，Hermes更懂你。”

两个框架，同样开源、同样支持自托管、同样能接入多平台消息……乍看之下，难分伯仲。但真正用过的人却会告诉你： “这俩根本不是一回事！” 那么，Hermes Agent 到底是什么？它和 OpenClaw 的本质差异在哪里？今天的文章笔者就和大家一起学习Hermes Agent的核心特性。

一、Hermes Agent是什么？

Hermes Agent 是由 Nous Research 于 2026 年 2 月开源的一款智能体框架。它的核心定位非常独特：不是传统的工具编排框架，而是一个“自我增强型 Agent 运行时”。

有人会问“现在已经有OpenClaw这个强大的Agent了，突然出来这么一个框架是干什么用的呢？”，笔者通过如下例子帮你秒懂：

你是否有过这样的经历？好不容易让 Agent 完成了一个复杂任务，可一旦重启，它就像失忆了一样，下次遇到同样的问题依然不会。任务做完了就真的做完了，仿佛什么都没发生过。

大家是否有过这样的经历？好不容易让 Agent 完成了一个复杂任务，可一旦重启，它就像失忆了一样，下次遇到同样的问题依然不会。任务做完了就真的做完了，仿佛什么都没发生过。

Hermes 就是为了解决这个“记忆与成长”的痛点而生的。 它内置了一套闭环学习机制：

执行（Execute） ：利用 40+ 内置工具完成任务
评估（Evaluate） ：自动判断结果好坏
抽象（Abstract） ：将成功经验写成可复用的 Skill 文档，存入自己的 skills/ 目录
精炼（Refine） ：下次遇到同类任务时，直接调用已有 Skill，并持续优化

据官方文档和社区实测，经过 10–20 次同类任务的反复执行，Hermes 的速度能提升 2–3 倍。这不是简单的缓存命中，而是真正的 经验积累。

在这里插入图片描述

除了持久的经验记忆和自动创建 Skill 之外，Hermes 同样保留了与 OpenClaw 类似的能力：

多平台消息网关：单一网关进程连接 Telegram、Discord、Slack 等，一次接入，处处可用
定时自动化任务：内置 cron 调度器，可向任意平台主动推送消息或触发动作
并行子智能体：为并行工作流生成隔离的子智能体，每个拥有独立的对话和终端；通过 RPC 将多步骤流水线压缩为零上下文消耗的操作
完整浏览器与网页控制：网页搜索、页面提取、完整浏览器自动化（导航、点击、输入、截图），同时支持视觉分析、图像生成、文字转语音和多模型协作推理

除此之外更值得关注的是，Hermes 还能将用户使用工具的调用轨迹完整导出到数据集，并集成Atropos 框架，进行强化学习训练，从而持续提升大模型调用工具的准确性。（解决了工具调用数据集生产这一大难题呀！）

二、Hermes 核心架构剖析：“分层递进 + 模块化”的设计哲学

要想真正理解 Hermes，必须深入它的核心架构。笔者通过分析 Hermes 的技术文档和源码，将其设计哲学抽象为以下几个要点，分享给大家。

2.1 核心抽象：中央编排引擎

Hermes 通过一个同步循环的中央编排引擎（代码位于 run_agent.py）统一调度四大模块：内存、记忆、工具、网关。所有消息——无论来自 CLI、Telegram 还是其他平台——都会进入这个引擎，流程如下：

消息到达 → 生成任务 ID → 加载缓存的系统提示（或从内存、技能索引重建）
→ 压缩预检 → API 请求 → 工具调用（如果需要）→ 结果追加 → 循环直到完成
→ 会话存入 SQLite → 通过网关发送回复

2.2 从记住到进化：四层记忆系统

在这里插入图片描述

2.2.1 第一层：陈述性记忆(MEMORY.md/USER.md)

Hermes 将陈述性记忆拆分为两个文件，且刻意限制容量，迫使 Agent 只保留最有价值的信息：

文件	字符上限	内容	类比
MEMORY.md	2,200	环境事实、项目约定、学到的经验	Agent 的工作笔记
USER.md	1,375	用户偏好、沟通风格、期望、工作习惯	Agent 对用户的画像

两者合计约 3,600 字符——这个限制是故意的，强迫 Agent 只保留最有价值的信息。

2.2.2 第二层情景记忆（SQLite+FTS5)

所有用户与 Hermes 的会话都会存入本地 SQLite 数据库，并使用 FTS5（SQLite 自带的全文搜索引擎，效率远高于 LIKE 模糊查询）建立全文索引。

当需要检索历史时，Hermes 不会把整段对话塞进上下文，而是：

通过 session_search 检索相关片段
让大模型对检索结果做摘要
仅将摘要后的相关内容注入上下文

2.2.3 第三层：程序性记忆（Skills）

这就是 Hermes 最受好评的设计——Skills。Agent 可以在与用户的对话中自动总结出可复用的操作指令集，存于 ~/.hermes/skills/ 目录下。

更妙的是：这些自动生成的 Skill 全部遵循 agentskills.io 规范，可以跨兼容的 Agent 迁移使用。

2.2.4 第四层：用户建模（Honcho）

前三层记忆都需要 Agent“主动写点什么”。第四层则完全不同：它不等待显式写入，而是在后台默默给你画像。

这一层名为 Honcho，是一个可选的用户建模层，架在所有记忆之上。它采用辩证建模思路，在 12 个身份层中同时建模“你”与“智能体”的互动关系，跨会话悄悄记录你的偏好、说话风格、专业领域，并随时间不断更新。

大多数专用任务或自动化场景，前三层已经足够。但如果你把 Hermes 当作日常私人助理，希望回复风格高度贴合你的工作习惯，Honcho 会非常值得开启。

2.3 五步循环：自进化闭环

如前所述，Hermes 的核心机制是运行时的自进化闭环，能够在与用户的对话中自动沉淀可复用的 Skill。其基本流程如下：

步骤	动作	触发条件	输出
① 引导	`SKILLS_GUIDANCE` 注入 system prompt	代码硬编码 / 用户触发	Agent 的“保存意识”
② 创建	`skill_manage(action='create')`	5+ 工具调用 / 修复错误 / 走通新流程	`SKILL.md` 文件
③ 索引	`prompt_builder` 自动扫描技能目录	会话启动时	system prompt 中的技能索引
④ 执行	`skill_view()` 加载完整内容	Agent 根据用户任务匹配	按步骤执行任务
⑤ 修复	`skill_manage(action='patch')`	执行中发现问题	更新对应的 `SKILL.md`

值得一提的是，Hermes 更新已有 Skill 时优先使用 patch（只传递旧文本和替换内容），而非全量重写——既节省 Token，又降低“把好用的部分改崩”的风险。

2.4 保护进化链：上下文压缩

大模型的上下文窗口有限，长对话容易溢出。Hermes 的 ContextCompressor 采用分层压缩算法：

剪枝：移除无用的工具调用结果
保护头部：保留 system prompt + 首轮对话
保护尾部：按 token 预算保留最近约 20K tokens
摘要中间轮次：用辅助 LLM 压缩中间内容，保留约 20% 信息
迭代更新：多次压缩时保留前次摘要，避免信息逐层丢失

2.5 默认零信任：安全机制

吸取了前期 OpenClaw 暴露的各种问题，Hermes 在设计上采用零信任默认策略：

每次写操作前扫描 12 种威胁模式（prompt_injection、role_hijack、exfil_curl 等）并需要用户确认
并发对话时，使用排他文件锁防止并发会话覆盖彼此写入
沙箱机制中，Docker 后端采用只读 rootfs，即使被攻破也无法持久化恶意代码

2.6 链接万物：网关机制

Hermes 的网关与 OpenClaw 有本质不同。在 OpenClaw 中，网关只管消息投递，与 Agent 是相互独立的两个个体；而在 Hermes 中，网关是中央编排循环的一部分。

它不仅通过独立适配器对接 CLI、Telegram、Discord、Slack、WhatsApp、Signal、邮件等，还通过一个会话路由层进行统一汇总。正因为网关与循环、会话路由是统一的，Hermes 能提供跨平台的无缝体验——你在 Telegram 上问的问题，最后甚至可以在终端中继续同一个话题。

在这里插入图片描述

2.7 真隔离：子智能体

Hermes 的子智能体机制设计得十分彻底。每个子智能体都拥有：

全新的对话上下文
独立的终端会话
受限的工具集

子代理的上下文与父代理丝毫不冲突，父代理只需拿到执行结果即可。这种隔离比很多框架的“同上下文分支”要彻底得多，是真正的“真隔离”。

三、Hermes vs OpenClaw：最强 Agent 框架花落谁家？

Hermes Agent 问世后，网络上讨论最多的问题就是：它和 OpenClaw 到底哪个更强？ 这节内容，笔者从六个维度进行硬核对比，帮大家理清思路。

在这里插入图片描述

3.1 架构风格：Agent-First vs Gateway-First

框架	架构风格	核心逻辑
Hermes	Agent‑First	Agent 本体是核心，消息网关只是“表面之一”。更像一个通用 Agent，顺便支持 Telegram、Discord 等渠道。
OpenClaw	Gateway‑First	消息网关是单一真相源，所有消息从 50+ 渠道汇入网关，再路由到 Agent。更像智能助理的操作系统。

3.2 设计哲学：成长 vs 治理

框架	设计哲学	核心目标
Hermes	成长（Growth）	“Agent 应该越用越聪明”——自我学习、Skill 进化、深度个性化是系统设计的核心目标。
OpenClaw	治理（Governance）	“平台边界必须清晰”——会话隔离、工具策略、权限治理、多用户支持是核心考量。

3.3 任务执行：单 Agent 深度 vs 多 Agent 协作

框架	执行模式	适用场景
Hermes	单 Agent 深度 + 子代理委派并行	强调“一个超级大脑”的连续性，适合个人深度助理或复杂任务链条。
OpenClaw	Hub‑and‑Spoke 多 Agent 协作	多 Agent 通过网关协调，更适合团队协作、多角色分工场景。

3.4 生态集成

维度	Hermes	OpenClaw
LLM 支持	200+（OpenRouter、Nous Portal、Ollama 等）	200+（OpenRouter、OpenAI、Anthropic 等）
消息渠道	7 个核心渠道（TG、Discord、Slack、WhatsApp、Signal、Email、CLI）	50+ 渠道（含 QQ、LINE、飞书、Teams 等）
Skill 生态	自生成 + 公共目录	5,700+ ClawHub 社区 Skill
MCP 支持	✅ 原生 + Server 模式	✅ 原生

3.5 记忆系统

框架	记忆架构	特点
Hermes	4 层架构（会话历史 + 用户画像 + FTS5 全文搜索 + 程序性 Skill）	语义密度高，支持自动学习与跨会话画像
OpenClaw	Markdown 文件 + SQLite	人类可读、易调试，但语义检索能力相对基础

3.6 部署与安全性

框架	部署难度	安全记录与设计
Hermes	一行命令搞定，部署成本接近零	Docker 后端采用只读根文件系统，默认零信任检查，安全加固较完善
OpenClaw	本地 / Docker 为主，部署简单	2026 年已曝出多个 CVE（令牌泄露、提示注入、RCE），安全事件相对较多

四、Hermes 和 OpenClaw，我要 Pick 谁？

通过前面的学习，大家应该已经掌握了 Hermes 的核心特性。这一节，笔者直接给出明确的适用场景和建议。

在这里插入图片描述

4.1 选 Hermes，如果你……

想要一个 “越用越懂你”的个人超级助理
重视安全默认值，不愿为漏洞操心
使用 Python 技术栈，想深入研究 Agent 的自我进化路径
任务类型偏向研究、分析、单 Agent 深度工作

4.2 选 OpenClaw，如果你……

需要多渠道统一接入（企业微信、飞书、Teams 等）
运行多 Agent 协作或团队工作流
重视平台治理、会话隔离、权限边界
想快速接入丰富的社区 Skill 生态（5,700+ 直接可用）

4.3 选型建议：两者可以兼得吗？

答案是：可以，而且聪明人已经在这么做了。

Hermes 官方提供了 hermes claw migrate 命令，可以直接导入 OpenClaw 的配置（人格文件、记忆、Skill、消息配置），迁移成本极低。

推荐的混合架构思路：

OpenClaw 作为运营网关：负责渠道接入、团队路由、权限治理
Hermes 作为学习层：负责深度个性化、Skill 自生成、复杂任务执行

两者互补，而不是非此即彼。如果你已经在一个框架上投入了精力，不妨用另一个作为增强层——这可能才是 2026 年最强 Agent 架构的“隐藏答案”。

五、总结

从 2025 年的“选型困难”，到 2026 年的“强者对决”，AI Agent 框架的进化速度远超想象。Hermes Agent 的出现，不是要简单地“取代”OpenClaw，而是为开发者提供了一条全新的路径：让 Agent 拥有真正的长期记忆与自我进化能力。

人工智能时代，对于我们程序员来说，也是一个难得的机会窗口。我们不仅是 Agent 的使用者，更可以发挥技术所长，成为 Agent 的创造者。

笔者的大模型 Agent 开发专栏——《深入浅出 LangChain & LangGraph AI Agent 智能体开发》 ——一直在持续更新。该专栏基于笔者在实际项目中的深度使用经验，系统讲解如何使用 LangChain / LangGraph 开发智能体，目前已更新 43 讲，并会持续补充实战与拓展内容。无论你是否接触过 LangChain，只要对 AI Agent 开发感兴趣，都欢迎关注我的CSDN账号

框架会迭代，Star 数会变化，但“让 Agent 持续成长”这个理念，才刚刚开始。