1.Hermes 详细介绍

Hermes Agent 是 Nous Research 于 2026 年 2 月推出的开源 AI Agent 框架,核心定位是”会自我进化的 AI 伙伴”。与传统 Agent 工具(执行完任务就失忆)不同,Hermes Agent 内置了一套闭环学习机制——它能从执行轨迹中自动提炼 Skill、在使用中迭代优化、并通过 Honcho 持续构建跨会话的用户画像。

项目采用 Python 编写,MIT 协议开源,截至 2026 年 4 月已拿下 32.1k GitHub Stars、4.1k Forks、3472 次提交。它支持 200+ LLM 模型(通过 OpenRouter/Nous Portal/OpenAI 等),可运行在 $5 VPS、Docker、Modal 无服务器等多种环境,用户通过 CLI、Telegram、Discord、Slack 等渠道与它交互。

Hermes Agent 的出现恰逢开源 Agent 领域的”王者易主”时刻:前王者 OpenClaw(小龙虾)因创始人出走 OpenAI、Anthropic 封杀第三方订阅 API 而遭遇重创,大量用户正在迁移到 Hermes Agent

  1. 自我进化的闭环学习:执行 → 生成 Skill → 迭代优化 → RL 训练微调模型

  2. 模型无锁定:一条命令切换 200+ 模型,零代码改动

  3. 全渠道覆盖:CLI + Telegram + Discord + Slack + WhatsApp + Signal + IDE

  4. 无服务器部署:Modal/Daytona 实现按需唤醒,闲置零成本

2.Hermes 给我们带来的启示

Agent 从”工具”到”伙伴”的范式转变。Hermes Agent 证明了一个核心假设:Agent 的价值不在于能调多少工具,而在于能否随使用时间积累经验。 自进化 Skills 系统和 Honcho 用户建模,让 Agent 第一次真正具备了”越用越懂你”的能力。这对我们做智能助手产品的启示很大——记忆和学习机制应该是第一优先级,而不是工具数量。

开源 Agent 的”护城河”在于训练数据闭环。Hermes Agent 最深层的竞争力不在前端功能,而在它的 Tinker-Atropos RL 训练管线。用户产生的真实执行轨迹,经过压缩后直接喂给 GRPO(Group Relative Policy Optimization) 强化学习训练,持续优化 Nous 自家的 Hermes 系列模型。这形成了”模型 → Agent → 轨迹数据 → 训练 → 更强模型”的飞轮,是其他纯应用层 Agent 难以复制的。

Anthropic 封杀事件的行业影响。2026 年 4 月 Anthropic 切断第三方订阅 API,直接导致 OpenClaw 的商业模式崩塌。这给整个行业敲了警钟——依赖单一模型厂商的 Agent 产品极其脆弱。Hermes Agent 的模型无关设计(openrouter 200+ 模型任意切换)是正确的架构选择。

3.Hermes 核心介绍

3.1 Hermes 系统架构总览

Hermes Agent 采用分层解耦架构,将用户交互、推理引擎、技能进化、记忆持久化和代码执行彻底分离。这种设计让同一个 AIAgent 核心可以同时服务 CLI 终端、多个消息平台和 IDE 插件,而底层可以在本地进程和远程无服务器容器之间自由切换。

图片

整个系统分为五个层次:

  • 用户入口层:CLI(全功能 TUI,支持多行编辑和 slash 命令补全)、Telegram/Discord/Slack/WhatsApp/Signal 消息网关、ACP 适配器(供 VS Code/Zed/JetBrains 接入)

  • 核心引擎层:AIAgent 类是全平台共享的同步编排器,内含 Prompt Builder(从md、Memory、Skills、Context Files 组装系统提示)、Tool Registry(40+ 内置工具)、Context Compressor(迭代压缩长会话)

  • 技能层:Skills System 负责技能的自动创建、存储、加载和迭代优化,兼容io 开放标准

  • 记忆层:SQLite + FTS5 全文搜索处理本地会话存储和检索;Honcho 插件负责跨会话辩证式用户建模

  • 执行层:6 种 Terminal Backend 提供隔离的代码执行环境

3.2 Agent Loop 核心引擎

AIAgent 类是整个系统的指挥中枢,负责完整的消息处理生命周期。它以同步方式运行,控制 Provider 选择、Prompt 构建、工具调用、重试、回退和回调。

核心流程是:接收用户消息后,Prompt Builder 将人格文件(SOUL.md)、持久记忆(MEMORY.md + USER.md)、当前激活的 Skills、上下文文件(AGENTS.md 等)拼装成完整的系统提示。然后调用 LLM 推理,如果返回 tool_call,则交由 Tool Registry 分发到对应工具执行。工具结果追加到会话历史后继续循环,直到 LLM 返回文本回复或达到最大轮次。

值得注意的是,Hermes 支持三种 API 模式——chat_completions(OpenAI 兼容)、codex_responses(OpenAI Codex 风格)、anthropic_messages(Anthropic 原生),这让它能无缝对接各家模型厂商的原生接口而非只走兼容层

上下文压缩器(Context Compressor)是另一个亮点。当会话超长时,它用辅助 LLM(廉价快速模型)对中间轮次做结构化摘要(Goal/Progress/Decisions/Files/Next Steps),同时保护头部(系统提示)和尾部(最近上下文),并在 LLM 摘要前先做一轮 Tool Output Pruning 预处理以节省 token。

3.3 自进化 Skills 系统

Skills 是 Hermes Agent 最核心的差异化能力——它不只是存储工具调用模板,而是一套完整的”过程性记忆”机制。

图片

工作机制如下:当 Agent 完成一个复杂任务后,它会分析执行轨迹并自动生成一个 Markdown 格式的 Skill 文件。这个文件记录了任务的目标、步骤、调用的工具序列和关键决策点。下次遇到类似任务时,Agent 会从 Skills 库中加载对应的 Skill 注入到系统提示中,相当于”回忆起上次是怎么做的”。

更关键的是,Skill 不是写一次就不变的。Agent 在使用 Skill 的过程中会评估效果,如果发现更优解,会自动更新 Skill 文件。这构成了一个”创建 → 使用 → 评估 → 优化”的闭环进化回路。

Skills 采用 agentskills.io 开放标准格式,具备跨 Agent 可移植性。用户可以在 Skills Hub 上分享和下载社区贡献的 Skills。在消息平台上,已安装的 Skills 会自动注册为 slash 命令,方便直接调用。

3.4 多层记忆架构

Hermes Agent 的记忆系统分两层,各自解决不同粒度的问题。

本地层是 SQLite 数据库(hermes_state.py 管理),用 FTS5 索引实现全文搜索,存储会话历史、会话谱系(父子关系跟踪压缩产生的分叉)和文件持久记忆(MEMORY.md、USER.md)。这一层的搜索能力让 Agent 可以跨会话检索历史对话,配合 LLM 做摘要总结,实现”记得上个月聊过什么”。

云端层是 Honcho 插件(plugins/memory/honcho/), 它实现了一种”辩证式用户建模”——不是简单记录用户说了什么,而是通过持续的 Q&A 推理来构建对用户偏好、知识领域和行为模式的深层理解。Honcho 支持三种召回模式:hybrid(混合检索)、context(上下文注入)和 tools(作为工具暴露给 LLM 按需查询)。

两层之间通过 sync 机制保持一致:本地 SQLite 负责快速读写,Honcho 负责跨设备、跨平台的持久化同步。

3.5 六种执行后端

Agent 的推理能力和代码执行环境彻底解耦,支持 6 种 Terminal Backend:

后端

适用场景

特点

Local

个人开发机

零配置,直接用本地 shell

Docker

安全隔离

容器沙箱,危险命令不影响宿主机

SSH

远程服务器

Agent 在本地推理,命令在远程执行

Daytona

无服务器工作区

按需唤醒,闲置自动休眠,持久化存储

Modal

无服务器计算

GPU 集群支持,闲置零成本,内置 AsyncWorker 解决事件循环冲突

Singularity

科研/HPC

适配高性能计算集群环境

Daytona 和 Modal 是其中最有意思的选项——它们让 Agent 的运行环境在不活跃时自动休眠,被消息唤醒后恢复到上次状态。用户可以通过 Telegram 发消息唤醒一个跑在 Modal 上的 Agent,完成任务后它自动休眠,全程只计费活跃时间。

3.6 强化学习训练管线

这是 Hermes Agent 区别于所有竞品的”隐藏武器”——它不仅是一个 Agent 框架,还是一个 RL 训练数据生成器。

系统通过 Tinker-Atropos 框架(Nous Research 自研)将真实用户的执行轨迹转化为训练数据,用 GRPO + LoRA 微调 Hermes 系列模型。整个管线分三个模式运行:

  • serve 模式:连接 Atropos API Server(run-api),做在线 RL 训练。这里有个精巧的工程细节——由于某些 Hermes 工具(如 Modal 后端)内部用了 run(),而 Atropos 事件循环不允许嵌套,Modal 环境用了一个专用的 AsyncWorker 后台线程来隔离异步调用

  • process 模式:快速推理测试

  • evaluate 模式:标准数据集基准测试

轨迹压缩器(trajectory_compressor.py)负责将原始执行轨迹精简为高质量的 ShareGPT 格式训练数据,去除冗余的工具输出,保留关键决策路径

这条管线形成了 Nous Research 的核心飞轮:用户用 Hermes Agent → 产生执行轨迹 → 压缩为训练数据 → GRPO 微调模型 → Hermes 模型工具调用能力提升 → Agent 更好用 → 更多用户。

3.7 全渠道消息网关

Gateway 是一个单进程多平台适配层,一次启动即可同时连接所有消息平台。各平台的关键适配细节:

  • Telegram:支持 Webhook 生产部署、Private Chat Topics 做项目隔离、群组提及策略(始终响应/@提及/正则触发)

  • Discord:交互式按钮审批 UI,用于危险命令确认

  • Slack:多工作区 OAuth 支持,线程回复

  • WhatsApp:持久 aiohttp 会话,Linked ID 到手机别名的映射

  • 其他:Signal、Matrix(原生语音消息)、Mattermost、SMS、Email、DingTalk、飞书、企业微信

用户在任一平台发送的消息都会路由到同一个 AIAgent 核心,共享记忆和 Skills,实现真正的跨平台会话连续性。

4.竞品对比:Hermes Agent vs OpenClaw

4.1 市场背景与格局变化

2026 年初的开源 AI Agent 领域经历了一次板块级地震。此前统治市场的 OpenClaw(前身 Clawdbot/Moltbot)坐拥 250k+ Stars,是最流行的本地自托管 Agent。但它的繁荣建立在一个脆弱的基础上——通过伪装 Anthropic 第一方客户端 header,让用户用 月的或100/月的 Claude Max 订阅跑重度 Agent 工作负载,而非走按量付费的 API。

两个事件在 2026 年初接连引爆:

  • 2 月,OpenClaw 创始人 Peter Steinberger 跳槽到 OpenAI,项目失去核心灵魂人物

  • 4 月 4 日,Anthropic 正式封杀第三方工具的订阅 API 访问,OpenClaw 用户被迫转向昂贵的按量计费

Nous Research 精准填补了这个真空,2 月发布 Hermes Agent,并内置了 hermes claw migrate 一键迁移工具来承接流失用户。

4.2 核心能力对比

图片

具体如下:

维度

Hermes Agent

OpenClaw

开发语言

Python

TypeScript

核心定位

自我进化的 AI 伙伴

万能工具箱

记忆能力

SQLite+FTS5 + Honcho 辩证式建模

静态 Markdown + SQLite 向量搜索

技能获取

自动创建 + 自我迭代

手动配置为主

消息通道

6 个(CLI/TG/DC/Slack/WA/Signal)

22+ 个(含 Teams/WeChat/Matrix 等)

可视化

无 Dashboard

Canvas 可视化界面 + iOS/macOS App

部署方式

本地/Docker/SSH/Modal/Daytona 无服务器

本地/Docker

模型锁定

无,200+ 模型任切

原先高度依赖 Anthropic 订阅

RL 训练

内置 Tinker-Atropos 管线

Stars

32.1k

250k+

协议

MIT

Apache-2.0

Hermes Agent 在深度(记忆、进化、RL 训练)上碾压 OpenClaw,但 OpenClaw 在广度(通道数量、可视化、移动端)上仍有优势。社区流行一个说法:“用 OpenClaw 做执行,用 Hermes 做大脑”——但越来越多重度用户已经把 Hermes 立为主力。

与其他 Agent 框架的快速对比:

  • Aider / Cursor:严格的代码助手/IDE,不是通用 Agent

  • Claude Code:Anthropic 第一方终端工具,锁定自家生态

  • Open Interpreter:Python 同源但偏单次会话,缺乏持久记忆和消息平台集成

4.3 迁移通道

Nous Research 为 OpenClaw 用户提供了零摩擦迁移路径:

hermes claw migrate              # 交互式迁移
hermes claw migrate --dry-run    # 预览不执行
hermes claw migrate --preset full --migrate-secrets  # 全量迁移含密钥

可迁移内容包括:

  • 人格文件(SOUL.md、AGENTS.md)

  • 记忆数据(MEMORY.md、USER.md、每日记忆文件,自动去重合并)

  • Skills(用户创建的技能导入到 ~/.hermes/skills/openclaw-imports/)

  • 配置(模型、Provider、Docker 沙箱、Cron 计划任务)

  • 消息平台设置(Telegram/Discord/Slack 等配置和允许用户列表)

  • API 密钥(需显式传 --migrate-secrets,支持冲突策略:skip/overwrite/rename)

5.版本演进与生态发展

5.1 版本迭代路线

Hermes Agent 保持极高的发布节奏,3 月底到 4 月初连续发布三个大版本,每版都有重量级特性。

  1. v0.5.0(2026.3.28)—— 安全强化版。侧重供应链安全和基础设施。移除了存在安全隐患的 litellm 依赖,固定版本范围并增加哈希锁文件。新增 Hugging Face 作为一等推理 Provider,支持 Modal SDK 原生集成(替代隧道依赖),激活了全生命周期插件 Hook(pre_llm_call / post_llm_call / on_session_start / on_session_end)。

  2. v0.6.0(2026.3.30)—— 多实例版。引入 Profile 隔离机制——每个 Profile 拥有独立的配置、记忆、会话和网关服务。新增 MCP Server 模式(hermes mcp serve),让 Cursor/VS Code/Claude Desktop 等 MCP 客户端直接连入 Hermes 会话。实现 Fallback Provider Chains(主 Provider 报错自动切换备选)。新增飞书和企业微信网关适配器。

  3. v0.7.0(2026.4.3)—— 韧性版。将记忆系统抽象为插件架构,恢复 Honcho 完整集成。新增 Credential Pool(线程安全的最少使用轮转,处理 429/401 限速)。集成 Camofox 反检测浏览器后端。支持客户端提供 MCP Server(让 IDE 把自己的 MCP 工具传给 Hermes Agent 使用)。单版本合并 168 个 PR,关闭 46 个 Issue。

5.2 社区生态与技能市场

agentskills.io 是 Hermes Agent 推动的开放技能标准。技能采用渐进式披露格式(按需加载内容以节省 token),具备跨 Agent 可移植性。

社区增长态势:

  • awesome-hermes-agent 列表(0xNyk 维护)快速增长到约 700 Stars

  • HermesInstall.com、LobeHub 等第三方平台开始托管社区 Skills 和付费 Agent 套件

  • 官方最近上线的 Skills 包括:research-paper-writing(端到端研究论文管线)、memento-flashcards(间隔重复记忆卡片)等

5.3 未来路线图

基于公开 Issue 和架构演进方向,Nous Research 正在推动三个关键方向:

  1. 多 Agent 编排架构(Issue #344):从单 Agent 循环进化为多角色协作,支持 spawn 子 Agent 做并行任务处理

  2. 可恢复交互(Issue #2971):API Server 暴露结构化运行事件,前端可暂停 Agent 等待用户输入后恢复执行

  3. 并发消息处理(Issue #5057):优化多消息在 Agent 执行轮次中同时到达时的行为

6.附录

6.1 快速安装

# 一键安装(Linux/macOS/WSL2)
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

# 刷新环境
source ~/.bashrc  # 或 source ~/.zshrc

# 首次配置
hermes setup    # 配置向导
hermes model    # 选模型
hermes tools    # 配工具

# 诊断
hermes doctor
hermes version

# 启动
hermes          # CLI 对话
hermes gateway start  # 消息平台网关

参考资料

官方资源

  • GitHub 仓库: https://github.com/NousResearch/hermes-agent

  • 官方文档: https://hermes-agent.nousresearch.com/docs/

  • Skills Hub: https://agentskills.io

  • Nous Research 官网: https://nousresearch.com

  • Discord 社区: https://discord.gg/NousResearch

技术文档

  • 架构文档: https://hermes-agent.nousresearch.com/docs/developer-guide/architecture

  • Skills 系统: https://hermes-agent.nousresearch.com/docs/user-guide/features/skills

  • Memory 系统: https://hermes-agent.nousresearch.com/docs/user-guide/features/memory

  • MCP 集成: https://hermes-agent.nousresearch.com/docs/user-guide/features/mcp

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐