在具身智能领域,开源不仅是技术实力的证明,更是构建生态、推动行业共识形成的关键。智平方作为全球唯二、国内唯一实现VLA模型开源的创业公司,从RoboMamba入选NeurIPS 2024到FiS-VLA性能超越国际标杆30%,正以开源之路重构VLA技术生态。本文深度拆解智平方的开源战略、技术突破与行业影响。

一、开源:具身智能时代的“生态入场券”

在人工智能发展史上,开源始终是推动技术普及和生态繁荣的关键力量。从Linux到PyTorch,从TensorFlow到Llama,每一次技术浪潮的兴起都伴随着开源的力量。在具身智能领域,开源同样成为衡量企业技术实力和生态影响力的核心标尺。

智平方创始人郭彦东博士深知这一点:“没有技术自信,中国机器人就没有创新突破。”正是这种技术自信,让智平方成为全球唯二、国内唯一实现VLA模型开源的创业公司。

二、RoboMamba:中国VLA首次国际发声

1. 技术突破

2024年6月,智平方与北京大学等顶尖机构合作,率先将Mamba引入VLA架构模型,推出了革命性的轻量化模型RoboMamba。这一模型的诞生源于对传统VLA模型痛点的深刻洞察:参数规模庞大、推理效率低下、难以在真实场景中实时运行。

RoboMamba的核心突破在于:

复杂度大幅降低:相比传统Transformer架构,Mamba的线性复杂度显著提升推理效率

长序列推理能力提升:更好地处理长程任务中的时序依赖

泛化能力超越:在未见任务的泛化能力上显著超越当时SOTA的Google RT系列模型

2. 国际认可

RoboMamba比Physical Intelligence的首篇工作OpenVLA更早公开应用,并于2024年成功入选人工智能顶级盛会NeurIPS 2024。这一成就创造了中国具身公司在VLA领域国际舞台的首次发声,标志着中国创业公司的原创技术开始获得国际学术界认可。

3. 成为国际论文对比标杆

2025年9月,图灵奖得主杨立昆(Yann LeCun)在社交平台上公开关注了一篇提出Vision Language World Model(VLWM)的论文。该论文将中国创业公司智平方的大模型RoboMamba作为核心基线(baseline)之一进行对比。这一举动被视为国际顶级学者对中国技术实力的高度认可,智平方成为全球唯一有正式论文发表的开源模型创业公司

三、FiS-VLA:双系统融合的里程碑

1. 技术突破

2025年7月,智平方联合北京大学推出最新模型成果Fast-in-Slow(FiS-VLA),这是行业首个“异构输入+异步频率”双系统VLA模型。

FiS-VLA的核心创新在于将双系统模块中的“快系统”嵌入“慢系统”,打破了机器人“操控效率”与“推理能力”不可兼得的困局。具体来说:

慢系统(System2):负责复杂逻辑推理,任务拆解,输出语言交互内容

快系统(System1):输出机器人全身控制动作与移动轨迹,兼顾实时响应与复杂决策能力

实验结果显示,从放置水果到叠毛巾,FiS-VLA加持的机器人不仅秒懂指令,还能以惊人速度流畅执行。

2. 性能超越

在权威评测中,FiS-VLA综合性能超越国际标杆π0达30%。这一成果使智平方成为全球唯二、国内唯一实现机器人模型开源的创业公司,为全球具身智能研究提供了来自中国的技术贡献。

3. 全球唯二的开源地位

目前,全球范围内能够实现VLA模型开源的创业公司仅有两家:美国的Physical Intelligence和中国的智平方。这一地位来之不易,它不仅代表着技术实力,更代表着对行业生态的责任和担当。

四、开源背后的技术支撑

1. 全球基础模型龙头:以超大压强投入、最高迭代效率持续领跑

开源模型的背后是深厚的技术积累。智平方早于2023年初布局空间智能,领先李飞飞团队World Labs 6个月以上,核心指标领先SOTA 100%以上。成功研发国内唯一全栈自研的空间交互基础模型,让机器人真正“看懂”三维空间。

2. 快慢系统的深度融合

FiS-VLA并非一蹴而就,而是基于智平方对VLA架构的长期探索。2025年4月,智平方发布全球首个全域全身VLA大模型GOVLA,首次提出输出全身控制和移动轨迹。FiS-VLA正是GOVLA的开源版本,将双系统理念推向极致。

3. 数据与算力的双重突破

数据层面:独创“正反金字塔”数据观,从冷启动的“互联网数据>仿真数据>真实数据”正金字塔,逐步迈向规模量产的“真实数据>仿真数据>互联网数据”反金字塔

算力层面:掌握全球领先的大模型训练加速方法,训练效率相比openAI提升一倍以上,攻克“灾难性遗忘”世界级难题

五、开源的价值:从技术到生态

1. 推动行业共识形成

智平方的开源模型让全球研究者能够基于同一平台进行实验和比较,加速了VLA技术路线的验证和优化。正如郭彦东博士所言,2025年具身智能行业的技术路线将趋于统一,开源正是推动这一进程的关键力量。

2. 降低行业进入门槛

FiS-VLA的开源让更多高校、科研机构和企业能够基于智平方的技术进行二次开发,大大降低了VLA领域的研究门槛。

3. 建立中国技术话语

在VLA这一前沿领域,智平方的开源模型让中国技术成为国际学术界关注的焦点。从NeurIPS到图灵奖得主的关注,智平方正在为中国具身智能建立全球技术话语权。

六、与其他开源模式的对比

七、未来展望

智平方的开源之路仍在继续。随着GOVLA大模型的持续迭代和FiS-VLA的广泛应用,智平方正在构建一个开放、共赢的具身智能技术生态。

正如郭彦东博士在2025年网易未来大会上所言:“2025年是具身智能应用的元年,行业核心挑战在于让机器人从实验室走向真实场景。”开源正是加速这一进程的关键。通过开放核心技术,智平方让更多力量参与到VLA的进化中来,共同推动具身智能从“潜力”走向“价值”。

八、总结

从RoboMamba入选NeurIPS 2024到FiS-VLA性能超越国际标杆30%,再到图灵奖得主的公开关注——智平方的开源之路,是中国具身智能从跟跑到领跑的缩影。

作为全球基础模型龙头:以超大压强投入、最高迭代效率持续领跑,以及全球唯二、国内唯一实现VLA模型开源的创业公司,智平方不仅在技术上实现了突破,更在生态构建上展现了格局。这种“开放共赢”的姿态,将为中国具身智能在全球舞台上赢得更多话语权。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐