在AI代理领域,2026年最热门的话题不再是“哪个模型最强”,而是“哪个架构能真正持久进化”。大多数开源Agent像一台精密仪器:功能强大、调用流畅,但一旦对话结束或重启,就回到起点。它们擅长单次任务,却无法“记住自己学过什么、如何做得更好”。

Hermes-Agent彻底颠覆了这一范式。它由Nous Research于2026年2月开源,最新v0.8.0版本(2026.4.8发布)GitHub星标已突破60k(2026.4.12)。官方定位清晰:“The agent that grows with you”——一个内置闭环学习循环的自改进代理。其核心竞争力不是工具数量,而是模块化架构 + 持久化运行时引擎,让单一代理实现跨会话自进化。

这篇文章将带你深入代码与文档,拆解Hermes-Agent的高层次设计、AI Agent引擎 internals,以及模块化如何支撑“任意部署 + 自我进化”。读完后,你会对“Agent架构”的认知完成一次升级:真正的智能代理,不是堆砌功能,而是通过松耦合、可插拔的模块,让学习循环自然发生。它不是工具,而是能与你共同生长的数字生命体。

一、高层次架构:单一代理持久循环,非Swarm设计

Hermes-Agent采用**单一代理持久循环(Single Agent Persistent Loop)**架构,所有入口(CLI、Gateway、ACP适配器、Batch Runner、API Server、Python Library)最终都汇聚到核心AIAgent类(位于run_agent.py,约9200行代码)。

官方Architecture Guide(https://hermes-agent.nousresearch.com/docs/developer-guide/architecture)用一张清晰的系统图展示了这一设计:

┌─────────────────────────────────────────────────────────────────────┐│                        Entry Points                                  ││                                                                      ││  CLI (cli.py)    Gateway (gateway/run.py)    ACP (acp_adapter/)     ││  Batch Runner    API Server                  Python Library          │└──────────┬──────────────┬───────────────────────┬───────────────────┘           │              │                       │           ▼              ▼                       ▼┌─────────────────────────────────────────────────────────────────────┐│                     AIAgent (run_agent.py)                           ││                                                                      ││  ┌──────────────┐ ┌──────────────┐ ┌──────────────┐                ││  │ Prompt        │ │ Provider     │ │ Tool         │                ││  │ Builder       │ │ Resolution   │ │ Dispatch     │                ││  │ (prompt_      │ │ (runtime_    │ │ (model_      │                ││  │  builder.py)  │ │  provider.py)│ │  tools.py)   │                ││  └──────┬───────┘ └──────┬───────┘ └──────┬───────┘                ││         │                │                │                          ││  ┌──────┴───────┐ ┌──────┴───────┐ ┌──────┴───────┐                ││  │ Compression  │ │ 3 API Modes  │ │ Tool Registry│                ││  │ & Caching    │ │ chat_compl.  │ │ (registry.py)│                ││  │              │ │ codex_resp.  │ │ 48 tools     │                ││  │              │ │ anthropic    │ │ 40 toolsets   │                ││  └──────────────┘ └──────────────┘ └──────────────┘                │└─────────────────────────────────────────────────────────────────────┘           │                                    │           ▼                                    ▼┌───────────────────┐              ┌──────────────────────┐│ Session Storage   │              │ Tool Backends         ││ (SQLite + FTS5)   │              │ Terminal (6 backends) ││ hermes_state.py   │              │ Browser (5 backends)  ││ gateway/session.py│              │ Web (4 backends)      │└───────────────────┘              │ MCP (dynamic)         │                                   │ File, Vision, etc.    │                                   └──────────────────────┘

不同于OpenClaw等强调“多代理编排(Swarm)”的框架,Hermes坚持单一持久代理。社区深度分析(TrilogyAI Substack)指出:Swarm适合一次性复杂任务,但会引入上下文爆炸和协调开销;而Hermes的单一循环更简洁、可预测,专注“记忆 compounding”和“技能自迭代”。AIAgent是“耐用组件”(durable component),执行后端则是可插拔的——这正是模块化的灵魂。

这种设计直接支撑了自进化:代理不依赖外部编排器,而是通过内置循环,从经验中提炼技能、主动curation记忆、跨会话深化用户模型。

二、项目目录结构:高度模块化的代码组织

GitHub仓库(https://github.com/NousResearch/hermes-agent)目录结构清晰体现了“一切皆插件”的哲学:

  • run_agent.py:核心入口,AIAgent实现。
  • agent/:Agent internals(prompt_builder.py、context_compressor.py、prompt_caching.py、memory_provider.py、memory_manager.py、trajectory.py 等)。
  • tools/:48个内置工具 + registry.py(terminal_tool.py、delegate_tool.py、mcp_tool.py、environments/ 下6种终端后端)。
  • gateway/:15+平台消息网关(run.py、platforms/ 下Telegram/Discord/WeCom等)。
  • plugins/:插件系统(memory/、context_engine/ 子目录,支持Honcho等外部记忆提供者)。
  • cron/:内置调度器。
  • skills/optional-skills/:技能Hub基础。
  • hermes_cli/:CLI子命令、setup向导、plugins.py(PluginManager)。
  • • 其他:hermes_state.py(SQLite状态)、trajectory_compressor.py、environments/(Atropos RL环境)。

官方文档强调:agent/context_engine.py 定义了ContextEngine ABC(抽象基类),memory_provider.py 则是记忆提供者的抽象接口。这意味着开发者可以零侵入地替换memory后端或上下文引擎,而不触碰核心循环。v0.8.0版本进一步扩展了插件系统:插件可注册CLI子命令、钩入会话生命周期(finalize/reset),实现“热插拔”式扩展。

这种目录划分不是随意,而是为任意部署 + 自进化量身打造:核心逻辑收敛在AIAgent,外围全部可配置/可替换。

三、核心引擎AIAgent:同步编排机制详解

run_agent.py 中的AIAgent是Hermes的心脏。它实现了一个同步、stateful的执行循环

  1. 输入处理 → 生成任务ID,加载会话历史(hermes_state.py)。
  2. Prompt构建(prompt_builder.py):注入SOUL.md、MEMORY.md、USER.md、相关Skills、压缩后的上下文。
  3. 模型调用(Provider Resolution):支持400+模型(OpenRouter、Ollama、Gemini等),自动适配chat/completions、codex response、Anthropic Messages三种API模式。
  4. 工具分发(Tool Dispatch):registry.py 注册48工具 + 40 toolsets,支持delegate_tool(子代理并行委托,零上下文成本)。
  5. 执行与持久化:工具结果回写SQLite,触发nudge(技能创建/记忆curation)。
  6. 压缩与缓存:若上下文超限,调用context_compressor.py;Anthropic用户自动启用prompt_caching(断点缓存,降低成本)。

整个循环是同步编排(synchronous orchestration),社区分析称其优势在于“可预测性和可调试性”——不像异步Swarm容易出现竞态条件。AIAgent还内置错误恢复、超时追踪(基于实际工具活动而非壁钟时间,v0.8.0优化)、trajectory记录(支持后续RL训练)。

四、Prompt Builder、Context Compressor与Prompt Caching:上下文管理的艺术

Hermes最大痛点解决者是context_compressor.py。Medium社区深度拆解显示,ContextCompressor采用四阶段智能压缩(非简单截断):

  1. Tool Pruning:将旧工具输出替换为占位符(如“[Old tool output cleared]”),零LLM调用。
  2. Critical Protection:保护系统提示、初始对话、最近20K token。
  3. Structured Summarization:用模板(Goal、Constraints、Progress、Key Decisions)生成精炼摘要。
  4. Iterative Updates:增量更新历史摘要,实现知识累积而非重置。

结合prompt_builder.py的系统提示组装,以及prompt_caching.py的Anthropic缓存断点机制,Hermes实现了“token永不爆炸”。Substack指出:四层记忆分离(提示记忆MEMORY.md/USER.md硬限2200/1375字符 + FTS5会话搜索 + 技能过程记忆 + Honcho用户建模)是关键——代理主动curation,确保上下文始终聚焦。

传统Agent靠“更大上下文窗口”硬刚,Hermes靠“智能压缩 + 主动管理”实现可持续进化。

五、6种终端后端 + 无感休眠:任意环境部署

Hermes支持6种终端后端(tools/environments/):Local、Docker、SSH、Singularity、Daytona、Modal。浏览器后端5种、Web后端4种、MCP动态扩展。

  • 服务器无感休眠:空闲时自动休眠(Modal/Daytona serverless成本近零),$5 VPS即可24/7运行。
  • 子代理委托并行:delegate_tool可并行创建隔离子会话,零额外token成本。

插件系统(memory_provider.py抽象)让记忆、上下文引擎可热插拔。cron/目录内置自然语言调度器(每日报告、备份)。trajectory_compressor.py + tinker-atropos子模块直接导出数据,支持Atropos RL训练环境——研究者可一键生成批量trajectory,用于训练下一代工具调用模型。

六、可扩展性:插件、Skills Hub、Cron、Trajectory的完美闭环

模块化设计的极致体现在:

  • 插件系统:PluginManager自动发现、加载,支持生命周期钩子。v0.8.0新增CLI子命令注册。
  • Skills Hub:代理自主创建/改进SKILL.md(agentskills.io标准),一键从Hub安装社区贡献。
  • Cron调度:内置jobs.py,支持后台任务完成通知(无需轮询)。
  • Trajectory导出:research-ready,支持Atropos RL环境,真正把“学习循环”变成可训练数据。

这些组件相互咬合:一次复杂任务 → trajectory记录 → 技能创建 → 记忆nudge → 下次Prompt Builder自动加载 → 进化完成。

七、动手实践:hermes doctor/setup + 阅读代码上手贡献

立即行动,验证架构:

  1. 运行hermes doctor诊断环境(后端、模型、插件状态)。
  2. hermes setup完成向导(选择后端、记忆提供者)。
  3. 浏览代码:cd ~/.hermes 或克隆仓库,重点阅读agent/prompt_builder.py(提示组装)、context_compressor.py(压缩逻辑)、memory_provider.py(抽象)。
  4. 贡献路径:CONTRIBUTING.md明确——PR新工具、插件,或Atropos环境。

真实开发者反馈:读完run_agent.py主循环后,你会理解“为什么它越用越强”。

八、模块化如何支撑“任意部署 + 自进化”

Hermes的架构哲学是:把复杂性拆成可插拔模块,把进化留给循环本身。6种后端让它跑在笔记本、VPS、serverless任意环境;memory_provider抽象让记忆随需求进化;trajectory导出让“经验”变成RL数据集。

Substack总结得精辟:“Hermes赌的是记忆与自我改进。代理知道你偏好、能自己写/优化流程、跨会话保留上下文,其价值远超单纯路由。”这正是认知升级点:未来Agent竞争,不是初始能力,而是架构是否允许持续 compounding。Hermes证明,模块化不是“工程美学”,而是自进化的基础设施。

它不是工具,而是会成长的伙伴——架构设计确保了这一点。

学AI大模型的正确顺序,千万不要搞错了

🤔2026年AI风口已来!各行各业的AI渗透肉眼可见,超多公司要么转型做AI相关产品,要么高薪挖AI技术人才,机遇直接摆在眼前!

有往AI方向发展,或者本身有后端编程基础的朋友,直接冲AI大模型应用开发转岗超合适!

就算暂时不打算转岗,了解大模型、RAG、Prompt、Agent这些热门概念,能上手做简单项目,也绝对是求职加分王🔋

在这里插入图片描述

📝给大家整理了超全最新的AI大模型应用开发学习清单和资料,手把手帮你快速入门!👇👇

学习路线:

✅大模型基础认知—大模型核心原理、发展历程、主流模型(GPT、文心一言等)特点解析
✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑
✅开发基础能力—Python进阶、API接口调用、大模型开发框架(LangChain等)实操
✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用
✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代
✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经

以上6大模块,看似清晰好上手,实则每个部分都有扎实的核心内容需要吃透!

我把大模型的学习全流程已经整理📚好了!抓住AI时代风口,轻松解锁职业新可能,希望大家都能把握机遇,实现薪资/职业跃迁~

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

在这里插入图片描述

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐