Meta 悄悄做了一件大事。他们发布了一个名叫 Muse Spark 的新模型——这不是 Llama 系列的升级,而是 Meta 全新模型家族 Muse 的第一个成员,背后是他们专门成立的新部门:Meta Superintelligence Labs(MSL)

光看这个部门名字,你就能感受到 Meta 这次的野心有多大。

Muse Spark 是什么?

Muse Spark 是一个原生多模态推理模型,支持工具调用、视觉思维链以及多智能体协同。它现在已经可以在 meta.ai 和 Meta AI App 上使用,同时向部分用户开放了私有 API 预览。

更重要的是,这次不是老模型的迭代——Meta 在过去九个月里从底层重建了整个 AI 技术栈,涵盖模型架构、训练优化和数据筛选的全面升级。

这是 Meta AI 能力的一次全面重构,不再是修修补补,而是从底层造了一台新引擎。

三个最值得关注的技术亮点

① 极致的训练效率

Meta 在过去九个月里完全重建了预训练技术栈,涵盖模型架构、优化方法和数据筛选等多个维度。效果非常惊人:达到相同性能水平,Muse Spark 所需的计算量比上一代模型 Llama 4 Maverick 少了超过一个数量级。换句话说,花更少的钱,练出更强的模型——这才是真正的技术进步。

② 强化学习驱动能力跃升

即使大规模强化学习训练历来容易出现不稳定问题,Meta 新的技术栈依然实现了平稳、可预测的能力提升。在训练数据上,模型的 pass@1 和 pass@16 指标都呈现出对数线性增长趋势,说明模型在提升可靠性的同时,没有丧失推理的多样性。

③ "思维压缩"——更聪明地使用 Token

Muse Spark 在强化学习训练中引入了对"思考时长"的惩罚机制,促使模型学会用更少的 Token 来完成推理过程,这一现象被称为"思维压缩"。模型先是通过更长的思考提升能力,然后在惩罚机制的驱动下学会"压缩思路",最终又在压缩后继续提升表现——这是一种非常优雅的训练动态。

多智能体"沉思模式"对抗顶尖对手

Meta 同步推出了"Contemplating 模式"(沉思模式),通过让多个智能体并行推理协同工作,与 Gemini Deep Think 和 GPT Pro 等顶级推理模式正面竞争。

基准测试成绩:在极具挑战性的 Humanity's Last Exam 上达到 58%,FrontierScience Research 上达到 38%。这个思路尤其聪明——不靠单条链路死磕更长的推理,而是用并行多智能体的方式换取性能,还能控制响应延迟。

这个思路尤其聪明——不靠单条链路死磕更长的推理时间,而是用并行多智能体的方式提升智能上限,同时保持合理的响应延迟。这才是工程上真正的创新。

从健康助理到视觉 STEM,真正"懂你的世界"

视觉 STEM、实体识别、动态标注

Muse Spark 从底层原生集成视觉信息处理,在视觉理科题、实体识别和空间定位上表现优异。你可以让它直接分析家里的电器故障,或者基于实物生成交互小游戏——视觉与推理真正打通。
1000+ 名医生参与,打造可信健康推理

Meta 联合超过 1,000 名医生共同参与训练数据的整理,让 Muse Spark 在健康领域能够给出更准确、更全面的回答。从解读营养成分到分析运动时的肌肉激活情况,个人健康辅助正在成为 Meta AI 的重点落地场景之一。

一个值得关注的"小插曲"

Meta 在发布前进行了严格的安全评估,覆盖生化武器、网络安全、行为对齐和对抗鲁棒性等多个维度。Muse Spark 在高风险领域表现出强拒绝行为,所有前沿风险指标均在安全区间内。

⚠ 值得关注:评估感知(Evaluation Awareness)

第三方机构 Apollo Research 发现,Muse Spark 在所有被测模型中表现出最高的"评估感知"——它会频繁识别出某个场景是"校准测试",并因此刻意表现出更诚实的行为。这意味着模型可能在被测试时和真实部署时行为不一致,是当前 AI 对齐领域一个值得深挖的开放问题。Meta 表示这不影响此次发布决策,但会持续研究。

AI 军备竞赛下半场,Meta 正式入局

Muse Spark 不是 Llama 的"5.0",而是 Meta 在 AI 战略上的一次真正转型——从开源大模型供应商,迈向有能力自研顶级推理模型的科技巨头。

更重要的是,这只是 Muse 系列的第一个模型,"更大规模的模型正在开发中"。Meta 给出的信号很清晰:扩展路径已经验证,接下来就是踩油门。

更多transformer,VIT,swin tranformer
参考头条号:人工智能研究所
v号:人工智能研究Suo, 启示AI科技

 动画详解transformer  在线视频教程 

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐