写在前面:

1. 双引号括起来的来自与原文或者原文的中文翻译。

2. 实验部分因为数据冗杂我会用AI解读,有AI解读的部分会用类似本导言一样包括起来。

3. 有任何建议欢迎在评论区指出。

来自于GEAR - Generalist Embodied Agent Research

是nvidia的通才具身研究的基座模型,本质上所有的工作都围绕着GR00T展开,为了实现大脑通用化。期待若干年之后实现具备能有清晰物理感知能力与规划操作能力的具身智能。

项目主页Isaac GR00T - Generalist Robot 00 Technology | NVIDIA Developer

代码仓库主页NVIDIA/Isaac-GR00T: NVIDIA Isaac GR00T N1.6 - A Foundation Model for Generalist Robots.

总体演进:N1 是NVIDIA首代开放通用人形机器人 VLA 基座;N1.5 在架构、数据与训练目标上系统性增强;N1.6 继续朝更快收敛、更平滑动作更进;N1.7 (推测)开始强调商业部署与高级灵巧控制;N2 (推测)则标志着 GR00T 从传统 VLAWorld Action Model 的下一阶段演进。

时间 名称 类型 定位 关键变化 来源
2024-03 Project GR00T 项目 / 平台 NVIDIA 的通才具身研究计划与开发平台,不是单一模型版本 GR00T 生态的起点,下面衍生出 GR00T-Gen、GR00T-Mimic、GR00T-Control 等工作流与模型路线。 NVIDIA 官方项目介绍
2025-03 GR00T N1 初代公开基础模型 第一代正式公开的人形机器人通用基础模型 核心路线是双系统 VLA:System 2 做视觉语言理解,System 1 用扩散 Transformer 做高频动作生成;是 N1.x 系列的起点。 NVIDIA Research
2025 FLARE 训练方法 : 世界建模增强 Robot Learning with Implicit World Modeling N1.5 相对 N1 的代表性技术增量之一。做 future latent alignment,用更低计算成本把世界模型式监督接入策略学习,还能从人类第一视角视频里吸收训练信号。 NVIDIA Research
2025 DreamGen 数据生成管线 通过视频世界模型生成神经轨迹,扩展机器人训练数据 GR00T 路线里最关键的数据扩展方案之一。它把缺机器人动作数据转化为先生成视频,再恢复伪动作,从而用世界模型补足训练数据缺口。 NVIDIA Research
2025-06 GR00T N1.5 N1 的首次正式升级版 在 N1 基础上同时升级架构、数据和训练目标 相较 N1 有更强的语言跟随、泛化与 grounding 能力,并加入了 FLARE 这类隐式世界建模监督和DreamGen通过视频世界模型生成神经轨迹数据。 NVIDIA Research
2026-01 GR00T N1.6 N1.x 持续迭代版 更成熟的公开 VLA 版本 比 N1.5 收敛更快、动作更平滑;GitHub 主分支也以 N1.6 为主,因此很适合写成“当前公开主线版本”。 NVIDIA Research
2026-03(预告) GR00T N1.7 早期商用版本 面向生产部署的 open reasoning VLA 公开信息还不算完整,但官方新闻稿已明确提到:early access + commercial licensing + advanced dexterous control。可概括为比 N1.6 更偏真实部署和商业化。 NVIDIA Newsroom
2026-03(预告) GR00T N2 下一代基础模型 从 VLA 路线迈向 World Action Model 路线 这是公开资料里最明显的一次路线升级。官方说它基于 DreamZero research、采用新的 world action model architecture,在新任务新环境中的成功率超过领先 VLA 模型 2 倍。 NVIDIA Newsroom
Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐