人形机器人开源资源大盘点(二):机器人操作系统与具身框架
如果说运动控制是人形机器人的“小脑”,负责维持平衡和实现基本移动,那么操作系统与具身框架就是机器人的“中枢神经系统”——它连接硬件与智能、协调各模块通信、承载AI模型的推理决策,是机器人走向智能化的关键基石。近年来,从企业自研系统的全面开源到AI原生操作系统的横空出世,一批重量级项目正在重塑人形机器人的软件生态。本文将为您梳理其中最具代表性的四个项目。
一、灵渠OS:智元机器人的自研操作系统
2026年3月,智元机器人正式开源了自研机器人操作系统“灵渠OS”Alpha版本。这套系统基于量产实践的全尺寸远征A2人形机器人本体开发,开源内容涵盖跨平台具身软件框架、基于强化学习的双足运控框架,以及双足运控仿真训练与部署一站式工具链。
灵渠OS的架构设计体现了一个清晰的理念——“南向适配具身硬件,北向支撑智能应用”。底层提供稳定、高效的分布式群体实时通信与硬件抽象服务;上层则开放智能体服务框架,支持交互、作业、运动等智能基座模型的标准化对接,降低应用门槛;中间层配套丰富的工具链,涵盖开发调试、仿真验证、部署管理、数据录制等能力,助力开发者快速构建从虚拟仿真到实体部署的技术闭环。
在技术实现上,灵渠OS有三大亮点值得关注:
第一,统一通信中间件AimRT。这是智元自研的高性能通信框架,支持Protobuf与ROS2 Message格式,提供RPC、Topic等多种通信模式,为模块间交互提供标准化、高效率的接口,同时完全兼容原生ROS2生态。这意味着开发者可以复用ROS2海量生态资源,同时享受AimRT在性能上的优化。
第二,高效的跨平台构建能力。灵渠OS支持x86_64到aarch64等异构平台的“一键式”交叉编译,提供Docker标准化开发环境,并配套图形化部署工具AimStudio,实现了从开发到部署的一体化流程。
第三,强化学习驱动的双足运控框架。基于MuJoCo和Isaac Gym两大仿真平台,灵渠OS构建了覆盖训练、仿真验证与真实机器人部署的一站式工具链。围绕PPO算法,该系统实现了稳定收敛、可复用的人形机器人站立与行走等运控策略训练,最大的亮点在于Sim2Sim/Sim2Real一体化支持——同一套策略代码可在MuJoCo仿真环境与真实机器人之间无缝切换运行。
灵渠OS的开源填补了国产自主机器人OS生态的空白,为行业提供了一套经过量产验证的标准化底层方案。其GitHub仓库地址:https://github.com/Link-U-OS[reference:10]。
二、OM1:全球首个AI原生开源机器人系统
2025年9月,硅谷初创公司OpenMind推出了OM1 Beta版本,以MIT许可证在GitHub上开源,号称全球首个“AI原生”开源机器人系统。OpenMind由斯坦福大学教授Jan Liphardt创立,将自己比作“机器人领域的安卓系统”——因为OM1是开放且与硬件无关的。
OM1的核心设计理念是“硬件中立”(Hardware Agnostic)。它可运行在四足、双足、人形与轮式等不同形态的机器人平台上,并以Docker镜像提供快速部署,兼容AMD64与ARM64架构。目前,OM1已原生适配宇树Unitree G1、Go2、TurtleBot以及优必选等机器人产品,方便开发者快速上手。
在AI能力集成方面,OM1支持即插即用接入OpenAI、Gemini、DeepSeek、xAI等主流大模型,并内置了即时定位与地图构建(SLAM)、LiDAR传感器与Nav2路径规划等自主导航能力。开发者可先通过Gazebo仿真环境进行行为测试,再将配置部署至实际硬件,从而降低实验成本与风险。此外,OM1还提供了名为OM1 Avatar的前端界面,基于React开发,可实时展示机器人状态与虚拟形象,方便观察和交互。
OM1的目标是为不同类型的机器人构建统一的开发基础,让它们在同一平台上实现感知、推理与行动,解决当前机器人软件层缺乏标准导致的开发成本高昂和系统整合困难的问题。
三、EMOS:面向物理AI的编排层
EMOS(Embodied Operating System,具身操作系统)是一个基于原生ROS2构建的开源框架,旨在为物理AI(Physical AI)提供生产级的编排层。与传统的机器人操作系统不同,EMOS的核心定位在于支持创建能够“理解、移动、操作并适应环境”的交互式智能体。
EMOS生态包含三个核心开源组件:EmbodiedAgents(智能层)、Sugarcoat(编排层)和Kompass(导航层)。其中,EmbodiedAgents作为系统的智能层,支持自引用逻辑——智能体可根据内部或外部事件启动、停止或重配置自身组件,并支持在云端和本地ML之间实时切换,同时内置了针对NVIDIA Jetson等边缘设备优化的本地大语言模型、视觉语言模型、语音识别与合成模型,可实现完全离线运行。
在学术层面,EMOS还是一个基于大语言模型的多智能体框架,专门用于异构多机器人系统的协作。其核心创新之一是“机器人履历”(Robot Resume)设计——智能体通过理解机器人的URDF文件并调用运动学工具,自主生成对自身物理能力的描述,以此指导任务规划和动作执行。这一设计让机器人不再依赖预设的角色定义,而是根据自身物理构成动态适应任务需求。
EMOS强调“简单、可扩展且可靠的部署体验”,目前已通过ROS官方索引发布,并保持持续更新。
四、智元灵犀X1:全栈开源的里程碑
在灵渠OS开源之前,智元机器人已经完成了一次堪称行业里程碑的开源行动。2024年1024程序员节,智元联合创始人稚晖君将灵犀X1人形机器人的全套资料面向全球开源,总资料超过1.2GB。
这次开源的彻底程度令人惊叹。硬件方面,包含230张详尽整机结构图纸、硬件框图和物料清单、装机说明——细致到每一个螺丝和齿轮,全部物料可通过自行加工或购买的方式获取。灵犀X1身高133厘米、重约33公斤,全身上下由两款自研的PowerFlow关节电机组装而成,具备中空走线、输出端绝对值编码、支持PF-Link智能接口等众多功能,标配的自适应夹爪OmniPicker仅用1个主动自由度即可实现泛化抓取,甚至能稳稳夹起桌面上平躺的一根针。
软件方面,开源内容涵盖AimRT平台组件、机器人URDF文件、仿真与Sim2Sim代码、强化学习训练代码、模型转换代码、运控推理代码以及调试工具(数据可视化、遥控器等),从软件到工程到运控算法的全部代码一应俱全。这套完整的开源方案让开发者能够利用强化学习等先进算法开发和优化个性化运控策略;对于科创公司和生态伙伴而言,他们可以基于智元的核心组件打造自己的人形机器人产品,并借助开源代码快速完成整机工程,大幅降低研发成本和门槛。
智元机器人也因此成为业内首家全栈开源人形机器人图纸和代码的公司。这一开源行动不仅兑现了稚晖君“人形机器人人人造”的诺言,还为人形机器人教育和产业生态建设奠定了坚实基础。
结语
从灵渠OS的国产自研系统,到OM1的AI原生硬件中立架构,再到EMOS面向物理AI的生产级编排层,以及灵犀X1的“图纸+代码”全栈开源——这些项目从不同维度定义了人形机器人的软件基础架构。
如果将人形机器人的开发比作建造一座城市,运动控制框架是“交通系统”,操作系统和具身框架则是“城市基础设施”——它为所有上层应用提供通信、调度、管理和智能承载的平台。随着这些开源基础设施的日益完善,人形机器人的开发门槛正在被不断拉低,更多开发者和研究者将有机会参与到这一变革性技术的共创之中。
核心项目速查表
|
项目名称 |
发布方 |
核心特点 |
开源地址 |
|---|---|---|---|
|
灵渠OS |
智元机器人 |
国产自研具身操作系统,AimRT中间件,Sim2Real一体化 |
github.com/Link-U-OS |
|
OM1 Beta |
OpenMind |
AI原生开源系统,硬件中立,MIT协议 |
GitHub搜索“OpenMind OM1” |
|
EMOS |
Automatika Robotics |
基于ROS2的物理AI编排层 |
github.com/automatika-robotics/emos |
|
灵犀X1 |
智元机器人 |
全栈开源(硬件图纸+软件代码),1.2GB资料 |
智元机器人官网开源页面 |
下一期,我们将聚焦仿真与开发工具链,敬请期待。
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐

所有评论(0)