1 月 1 日消息,智元具身研究中心今日宣布推出第二代一体化具身大小脑系统 GenieReasoner。
针对 VLA 模型中语义推理与动作控制的模态对齐难题,智元具身研究中心提出了一种支持统一离散化预训练的模型架构,并通过流匹配(Flow-matching)缓解了传统离散 Tokenizer 的动作精度瓶颈。
同时具身研究中心开源了 ERIQ-聚焦于真机操控全流程的具身推理评测基准,用以解耦量化评估 VLA 中具身大脑不同维度的推理能力。
实验表明,GenieReasoner 不仅在推理能力上达到 SOTA,更在跨本体真机实验中展现了 SOTA 级别的泛化性。进一步的对比实验证实:VLA 模型更强的具身推理能力可显著提升其端到端动作执行表现,从而验证了 ERIQ 的评估价值。
下一步,智元具身研究中心将从“逻辑深度”与“执行精度”两个维度持续推进,并致力于实现具身大小脑、世界模型(World Model)与真机强化学习(Real-world RL)的闭环协同。
智元具身研究中心已将 ERIQ Benchmark 完全开源,附项目地址如下:
https://geniereasoner.github.io/GenieReasoner/
文章来源:
IT之家
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至23467321@qq.com举报,一经查实,本站将立刻删除;如已特别标注为本站原创文章的,转载时请以链接形式注明文章出处,谢谢!