在 2026 年 5 月的 AI 圈,谈论“基座模型”已经变成了一件极其奢侈且充满焦虑的事。

上个月,阿里的 Qwen 3.6 凭借“思维持久化”技术再次刷爆 SOTA;Meta 则彻底告别了 Llama 时代,转向了高度集成的闭源系统 Muse Spark

在这个背景下,一个清醒的声音开始在开源社区放大:曾经的微调王者——来自 Nous Research 的 Hermes,是否已经沦为了时代的眼泪? 毕竟,Hermes-3 甚至是更早的产物,而基座性能的鸿沟似乎已经不可逾越。

然而,Hermes 的持续火爆揭示了一个被忽视的真相:它的成功,从来不是因为 Loss 跑得比别人低,而是因为它在系统工程上做到了基座厂商无法做到的极致。


反方:它是基座巨头阴影下的“附庸”吗?

从参数视角看,Hermes 的处境确实尴尬。

作为 Nous Research 的“二创”作品,它深度依赖 Meta 或阿里的基座。有人质疑,在 Qwen 3.6 已经原生支持 1M 上下文、且具备极强 Agentic Coding 能力的今天,基于“旧时代”基座微调出来的 Hermes 更像是工业时代的精致手工艺品。

特别是那些 8B 的小参数版本,逻辑能力在处理复杂任务时往往显得“鸡肋”。如果仅仅追逐原始参数和基座更新,Hermes 似乎早已在算力竞赛中掉队。

在这里插入图片描述


我们的论据:系统工程对参数霸权的降维打击

然而,Hermes 真正的护城河不在于它选了哪个基座,而在于它如何定义模型与人的交互方式

1. 跨模型的 Skill 固化:解耦“能力”与“参数”

Hermes 成功的核心在于它将“能力”从“参数”中解耦了。
通过 DataForge 管道,Nous Research 并不是在简单地“喂数据”,而是在固化 Skill。即便基座从 Llama 换成了 Qwen,Hermes 标志性的 <SCRATCHPAD> 逻辑、极致稳定的 JSON 工具调用,都能迅速迁移。
模型会过时,但经过验证的“解题思路”不会。

2. 中立对齐:极客心中的“避难所”

随着主流模型(如 Muse Spark)变得越来越“说教”且充满道德滤镜,Hermes 坚持的**中立对齐(Neutral Alignment)**显得弥足珍贵。它没有预设的道德立场,能像手术刀一样精准地执行开发者指令。在构建复杂的 Agent 系统时,开发者需要的是一个“听话的工具”,而不是一个“随时可能罢工的导师”。

在这里插入图片描述

3. 从“大脑”到“Agent 运行时”的蜕变

刚刚发布的 Hermes Agent v0.14.0 揭示了其终极防御:它已经进化为一个“模型无关”的 Agent 运行时。

  • 自演化 Skill 库:Agent 能在解决问题的过程中,自主生成并保存 Markdown 格式的 Skill 经验。
  • 长程记忆持久化:通过本地 SQLite 结合思维持久化补丁,它让轻量级模型在实战中表现得比笨重的原生模型更“清醒”。

结论:Hermes 是开源精神的工程胜利

回看 2026 年的 AI 格局:基座厂商在卷参数、卷算力;而 Hermes 在卷交互逻辑、卷开发者体验

结论是:Hermes 的成功,本质上是“微调工程学”对“暴力美学”的胜利。

它告诉我们:即使基座模型以月为单位更迭,那些被精心固化的 Skill 和被优化到极致的上下文交互逻辑,才是真正的“护城河”。未来的 AI 竞争,不再是单纯的参数霸权,而是看谁能更早地完成从“通用大脑”到“自带技能包的专业工匠”的跨越。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐