爆火全网!超56k Star!干翻OpenClaw ?新一代龙虾 Hermes Agent 保姆级架构解读教程
AI Agent圈近期热度持续走高,曾经风靡全网的OpenClaw还在被无数用户“养虾式”折腾,一款名为Hermes Agent的开源项目已收割18k+ GitHub Star,成为圈里的新晋顶流。

它跳出了传统AI工具“用完即忘、无状态运行”的固有逻辑,把「执行-学习-优化」的闭环刻进底层架构,主打可与用户共同成长的持久化AI智能体。这篇教程从底层架构到上手实操,全流程保姆级拆解,新手也能跟着一步步落地。

📝 项目速览
Hermes Agent由全球知名开源AI实验室Nous Research(Hermes大模型系列开发方)在2026年2月推出,是GitHub上少有的内置完整闭环学习系统的Agent项目,采用MIT开源协议,支持个人与商业二次开发,可免费商用。


和市面上多数AI工具不同,它从设计之初就瞄准「持久运行的自治系统」,不绑定IDE、不依赖单一API,可部署在各类基础设施上,跨会话留存用户偏好与任务经验,完成工作后自主沉淀可复用技能,运行时间越长,适配性与能力越强。

|
对比维度 |
Hermes Agent |
传统对话AI |
OpenClaw |
|---|---|---|---|
|
核心定位 |
可自进化的持久化自治智能体 |
无状态一次性对话工具 |
多渠道消息网关与调度系统 |
|
记忆能力 |
三层持久化记忆+全文检索,跨会话长期留存 |
单会话上下文记忆,重启即重置 |
依赖文件存储记忆,全量注入易超Token限额 |
|
技能体系 |
任务完成后自主沉淀、迭代技能 |
无原生技能沉淀能力 |
依赖人工编写与社区导入技能 |
|
部署形态 |
支持多环境部署,可7×24小时离线运行 |
依赖官方服务,无法自主部署 |
偏向本地部署,网关为核心模块 |
|
安全体系 |
七层纵深防御,容器隔离+命令审批+注入扫描 |
依赖模型自身安全能力 |
以插件权限管控为主,社区插件存在安全风险 |
|
模型适配 |
不绑定特定大模型,支持200+模型一键切换 |
绑定自有模型体系 |
支持多模型,配置流程相对繁琐 |
📝 核心架构
📌 模块拆解
Hermes Agent的架构形成了完整的自治闭环,从底层运行到上层交互,核心模块可拆解为7个部分,各模块各司其职,又能协同联动:

- 终端运行层:覆盖从个人笔记本到企业级集群的全场景部署,支持本地、Docker、SSH远程服务器、无服务器开发环境等6种终端后端,部分后端支持空闲休眠,闲置成本较低。
- 全平台消息网关:单进程可同时接入CLI终端、Telegram、Discord、飞书、企业微信等多个消息平台,跨平台对话上下文可同步,手机、电脑可无缝切换操作。
- 三层记忆引擎:采用「SQLite + FTS5全文检索 + LLM摘要」的技术方案,分为会话记忆、持久记忆、技能记忆三层,既保证核心信息的稳定注入,又能按需检索历史内容,减少Token无效消耗。
- 闭环学习系统:这是项目的核心差异化模块,堪称AI的「复盘进化中枢」,完成复杂任务后,会自动提取解决流程,生成标准化的技能文档,后续同类任务可直接调用,使用中发现更优方案,还会自动迭代优化技能。
- 内置工具集:自带40+开箱即用的工具,按类别划分管理,覆盖网页搜索、终端执行、文件操作、定时任务、图片分析等高频场景,无需额外配置即可启用。
- 安全防护层:搭建了多层安全防线,覆盖执行前到执行中的全流程,包括用户白名单、危险命令强制审批、容器隔离运行、上下文注入扫描等,降低操作风险。
- 模型适配层:不绑定任何特定大模型,支持主流模型服务商与自定义OpenAI兼容端点,一条命令即可切换模型,无供应商锁定问题。

📌 核心亮点
- 自主技能进化:无需人工编写技能代码,可从完成的任务中自主沉淀、迭代可复用的流程,减少同类任务的重复操作,能力可随使用持续拓展。
- 跨会话持久记忆:解决传统AI“健忘症”问题,可长期留存用户的工作习惯、偏好、项目背景,无需每次对话重复交代上下文信息。
- 全场景灵活部署:对硬件要求门槛较低,可运行在低配置VPS上,也可部署在GPU集群或无服务器平台,不依赖本地设备,关闭电脑也可持续运行任务。
- 全平台统一入口:单网关进程即可接入多个通讯平台,在任意平台发起的任务,可切换到其他平台继续执行,历史进度与上下文可同步。
- 自然语言定时任务:内置调度器,用自然语言即可设置定时任务,无需编写复杂的定时代码,执行结果可推送到指定的消息平台。
- 子智能体并行处理:可生成隔离的子智能体,同时并行处理多个工作流,提升复杂任务的处理效率。


📝 环境准备
|
环境项 |
要求说明 |
|---|---|
|
操作系统 |
支持Linux、macOS、WSL2;Windows原生系统暂不支持,需搭配WSL2环境使用 |
|
基础依赖 |
仅需预装Git,其余Python、Node.js等依赖可由安装脚本自动处理 |
|
网络要求 |
可正常访问GitHub与对应大模型API端点 |
|
核心资源 |
至少一个大模型提供商的API Key |
新手可优先选择OpenRouter,支持200+主流大模型,按量付费,无需管理多个API Key。

📝 安装步骤
📌 一键安装
打开对应系统的终端(macOS/Linux打开系统终端,Windows打开WSL2终端),执行以下一键安装命令:
代码语言:javascript
AI代码解释
curl-fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash
安装脚本会自动完成Python、Node.js、系统依赖、项目组件的安装与全局命令配置,全程几乎无需人工干预。
安装完成后,需重载Shell配置让全局命令生效:
- bash用户执行:
source ~/.bashrc - zsh用户(macOS默认)执行:
source ~/.zshrc
📌 安装验证
执行环境诊断命令,验证安装结果:
代码语言:javascript
AI代码解释
hermes doctor
若终端输出全量绿色对勾标记,说明安装成功;若出现红色报错,可根据终端提示修复对应环境问题。
📝 基础配置
安装完成后,完成核心配置即可正常使用Hermes Agent,核心配置分为三个部分:
📌 全量向导
新手可优先使用交互式全量配置向导,执行以下命令,跟着终端提示即可完成全流程配置:
代码语言:javascript
AI代码解释
hermes setup
向导会覆盖模型提供商、默认模型、工具权限、消息网关等核心配置项,全程可视化引导,降低配置门槛。
📌 模型配置
若无需全量配置,可单独执行模型配置命令,选择对应的大模型服务商:
代码语言:javascript
AI代码解释
hermes model
执行后会弹出交互式菜单,可选择主流模型服务商,粘贴API Key并选择默认使用的模型即可完成配置,后续也可通过该命令随时切换模型与服务商。
📌 工具配置
执行以下命令,可管理工具集的启用与禁用,按需开启对应工具,减少不必要的Token消耗与权限风险:
代码语言:javascript
AI代码解释
hermes tools
新手可优先开启web、terminal、file、memory、skills、cron这几个核心工具集,可覆盖多数日常使用场景。
📝 上手玩法
📌 CLI交互
完成配置后,执行以下命令,即可启动交互式终端,开始对话交互:
代码语言:javascript
AI代码解释
hermes
启动后,直接输入自然语言指令,即可让Agent执行对应任务。对话中可使用核心斜杠命令,快速完成对应操作。
核心命令
代码语言:javascript
AI代码解释
开启全新对话,清空当前会话上下文
入门示例
新手入门可尝试这些示例指令,快速熟悉核心能力:
- 信息检索:
总结2026年4月AI行业的3个核心热点新闻 - 文件操作:
在当前目录创建一个test文件夹,生成README.md文件并写入项目说明 - 定时任务:
设置定时任务,每天晚上8点检查服务器CPU、内存使用率,生成报告保存到server_status.log - 技能沉淀:
分析指定GitHub仓库的Star数、最近更新时间、核心功能与贡献者活跃度(完成复杂任务后,Agent会自动询问是否保存为可复用技能)
📌 网关配置
CLI终端仅支持本地使用,若要实现7×24小时在线、多设备随时访问,可配置消息网关,以常用的Telegram Bot接入为例,核心步骤如下:
- 打开Telegram,搜索@BotFather,发送/newbot命令,按指引创建Bot,获取Bot Token;搜索@userinfobot,获取个人数字User ID,用于白名单配置。
- 执行网关配置命令
hermes gateway setup,在菜单中选择Telegram,粘贴Bot Token与User ID,完成配置。 - 执行
hermes gateway临时启动网关,测试Bot是否正常响应;生产环境可执行hermes gateway install,将网关安装为系统服务,实现开机自启、后台常驻运行。
配置完成后,即可在Telegram上随时给Bot发送指令,即使关闭本地设备,只要服务器正常运行,Agent就可持续执行任务。飞书、Discord、Slack等平台,也可通过该网关配置命令完成接入。
📝 避坑指南
|
常见问题 |
原因分析 |
解决方案 |
|---|---|---|
|
安装脚本执行失败 |
网络无法访问GitHub,或缺少Git依赖 |
1. 执行git --version验证Git是否正常安装;2. 配置网络代理,确保可正常访问GitHub;3. 终止进程后重新执行安装命令 |
|
Windows系统无法安装 |
原生Windows暂不支持该项目 |
安装微软官方WSL2,在WSL2终端中执行安装与后续操作 |
|
消息平台Bot无响应 |
未配置用户白名单,或网关未正常启动 |
1. 检查白名单内的User ID是否配置正确;2. 查看网关服务运行状态与日志,排查报错信息 |
|
记忆内容不生效 |
本次写入的记忆当次会话不生效,或记忆未正确写入 |
1. 写入记忆后,重启Hermes Agent即可生效;2. 执行hermes memory命令,查看记忆是否正常写入 |
|
Token消耗过快 |
上下文未压缩,或开启了过多非必要工具 |
1. 定期用/compress命令压缩会话上下文;2. 禁用不需要的工具集;3. 选用性价比更高的模型 |
|
频繁弹出命令审批 |
未开启容器隔离,默认审批规则严格 |
1. 生产环境可开启Docker后端隔离,自动跳过危险命令检查;2. 可按需对信任的命令设置永久白名单 |
📝 适用场景
📌 适配场景
- 个人长期AI助手:可7×24小时在线,持续留存用户偏好,无需每次对话重复交代上下文,替代传统无状态对话AI。
- 开发者自动化运维:可实现服务器监控、自动备份、日志分析、项目自动部署等操作,沉淀运维技能,降低重复性工作负担。
- 跨平台工作中枢:可同时接入多个工作沟通平台,统一处理消息、任务、提醒,减少多软件切换的操作成本。
- 行业研究与数据分析:可定时检索行业新闻、研报、政策,自动抓取与清洗目标数据,生成标准化分析报告。
- 中小企业轻量自动化:可低成本部署在VPS上,实现客服自动化、运营数据统计、定时报表推送等功能,MIT协议支持商用。
📌 非适配场景
- 仅需简单AI对话,无部署与配置意愿的用户,传统网页版对话AI适配性更高。
- 需要深度本地系统集成、大量本地文件操作的场景,可选择对应适配性更强的工具。
- 对操作快照一键回滚、撤销有强需求的场景,需配合Docker隔离等方案补充对应能力。
Hermes Agent跳出了传统AI工具“单次调用、用完即忘”的固有逻辑,用闭环学习循环、持久化记忆、自主技能进化,实现了“与用户共同成长”的AI智能体形态。它不是一个固定功能的静态工具,而是可随使用持续迭代、深度适配用户需求的自治系统。

对于想要拥有私有、可定制、长期可用的AI智能体的用户,这个开源项目提供了较低的入门门槛,低成本即可搭建专属的7×24小时在线AI助手。目前项目仍处于快速迭代阶段,官方团队保持高频更新,后续的生态与能力还有较大的拓展空间。
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐



所有评论(0)