作者:张大鹏

本文是《Hermes Agent 深度解析》系列第 1 篇

系列索引

  • 篇01:入门指南(本文)←
  • 篇02:记忆系统 MEMORY.md
  • 篇03:技能系统
  • 篇04:跨会话搜索 FTS5
  • 篇05:工具系统

引言

背景

在 AI Agent 领域,大多数工具都是"一次性"的——你问完,它答完,下次再问就是全新的对话。Hermes Agent 打破了这一限制,它能记住你的习惯、创建可复用技能、在历史对话中搜索答案。

Hermes Agent 由 Nous Research 开发,是一个具有内置学习循环的自改进 AI Agent。

本文目标

阅读本文后,你将:

  1. 了解 Hermes Agent 的核心特性
  2. 掌握一键安装方法
  3. 完成首次配置和对话
  4. 理解 CLI / Gateway / TUI 三种入口

1. Hermes Agent 核心特性

1.1 内置学习循环

Hermes Agent 区别于普通 Agent 的核心能力:

能力 说明
技能自创建 完成复杂任务后自动创建可复用技能
技能自改进 技能在使用中持续优化
记忆持久化 MEMORY.md 定期更新,用户画像跨会话保持
会话搜索 FTS5 全文搜索 + LLM 摘要,跨会话召回

1.2 多后端执行环境

后端 说明 适用场景
local 本地直接执行 开发测试
Docker 容器化执行 隔离环境
SSH 远程服务器执行 已有服务器
Daytona / Modal Serverless,按需唤醒 低成本生产
Singularity HPC 场景 科研计算

1.3 多平台消息网关

Telegram、Discord、Slack、WhatsApp、Signal、Email——同一个 Agent,从不同平台都能对话。

1.4 模型无关

支持 OpenRouter(200+ 模型)、OpenAI、Anthropic、Nous Portal、小米 MiMo、z.ai/GLM、Kimi/Moonshot、MiniMax、HuggingFace 等。切换模型只需 hermes model


2. 一键安装

2.1 系统要求

  • Linux / macOS / WSL2 / Android (Termux)
  • Windows 用户需安装 WSL2

2.2 安装命令

# Linux / macOS / WSL2
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

安装程序自动处理:

  • Python、Node.js、ripgrep、ffmpeg 等依赖
  • Git clone 仓库
  • 虚拟环境配置
  • 全局 hermes 命令

2.3 安装后配置

# 重新加载 shell
source ~/.bashrc   # 或 source ~/.zshrc

# 运行设置向导
hermes setup

设置向导引导配置:

  • 推理提供商(Nous Portal / OpenAI / OpenRouter / 自定义端点)
  • API 密钥

2.4 验证安装

hermes

看到欢迎 banner 即安装成功。


3. 快速开始

3.1 基本对话

hermes

看到以下界面即可开始对话:

❯ What can you help me with?

3.2 常用命令

命令 说明
hermes 启动交互式 CLI
hermes setup 配置提供商和设置
hermes model 切换模型
hermes tools 配置工具启用状态
hermes gateway 启动消息网关
hermes doctor 诊断问题
hermes update 更新到最新版本
hermes --continue 恢复上一个会话

3.3 Slash 命令(聊天界面内)

输入 / 查看所有命令的自动补全:

命令 功能
/help 显示所有可用命令
/tools 列出可用工具
/model 交互式切换模型
/personality pirate 尝试有趣的人格
/save 保存对话

3.4 中断与恢复

中断 Agent:直接输入新消息并回车即可中断当前任务。

恢复会话

hermes --continue  # 恢复最近会话
hermes -c          # 简写

4. 三种入口模式

Hermes Agent 有三种使用方式:

4.1 CLI 模式(最常用)

hermes

终端交互界面,适合日常使用。

4.2 TUI 模式(界面更丰富)

hermes --tui

使用 React Ink 构建的终端 UI,界面更丰富。

4.3 Gateway 模式(后台服务)

hermes gateway start

后台服务,接收各平台(Telegram/Discord/Slack)消息。


5. 代码架构概览

5.1 文件依赖链

tools/registry.py  ← 所有工具的注册中心
       ↑
tools/*.py        ← 每个工具文件调用 registry.register()
       ↑
model_tools.py    ← 触发工具发现
       ↑
run_agent.py / cli.py / batch_runner.py

5.2 核心类:AIAgent

# run_agent.py
class AIAgent:
    def chat(self, message: str) -> str:
        """简单接口,返回最终响应字符串"""
        
    def run_conversation(self, user_message: str, ...) -> dict:
        """完整接口,返回 dict(final_response + messages)"""

5.3 Agent 循环

while api_call_count < max_iterations:
    response = client.chat.completions.create(
        model=model, messages=messages, tools=tool_schemas
    )
    if response.tool_calls:
        for tool_call in response.tool_calls:
            result = handle_function_call(tool_call.name, tool_call.args)
            messages.append(tool_result_message(result))
        api_call_count += 1
    else:
        return response.content

常见问题(FAQ)

Q1: Windows 能用吗?

不支持原生 Windows,请安装 WSL2 后在 WSL2 终端内使用。

Q2: 支持哪些模型?

支持 OpenRouter(200+)、OpenAI、Anthropic、Nous Portal、小米 MiMo、z.ai/GLM、Kimi/Moonshot、MiniMax、HuggingFace 等。

Q3: 如何切换模型?

hermes model

或在聊天界面内:

/model anthropic/claude-opus-4

Q4: 安装失败怎么办?

hermes doctor

诊断工具会检查依赖和环境问题。


总结

核心要点

  1. Hermes Agent 是具有内置学习循环的自改进 Agent
  2. 一键安装curl ... | bash 即可
  3. 三种入口:CLI / TUI / Gateway
  4. 模型无关:支持 200+ 模型,切换无代码改动

下篇预告

【系列02】Hermes Agent 记忆系统详解:MEMORY.md 与跨会话持久化

下一篇我们将深入解析 Hermes Agent 的记忆系统:

  • MEMORY.md 和 USER.md 的区别
  • 记忆如何注入系统提示
  • 容量管理和最佳实践
  • Honcho 跨会话用户建模

相关资料

  • 官方文档:https://hermes-agent.nousresearch.com/docs/
  • GitHub:https://github.com/NousResearch/hermes-agent
Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐