ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

智元具身研究中心发布GenieReasoner:破解VLA模型模态对齐难题

时间:2026-01-01 17:22:50来源:互联网编辑:快讯

近日,智元具身研究中心对外公布了一项重要技术突破——其研发的第二代一体化具身大小脑系统GenieReasoner正式亮相。这一成果聚焦于当前VLA模型发展中的关键瓶颈,即语义推理与动作控制两大模态间的对齐难题,为行业提供了新的解决方案。

在传统技术框架下,语义推理与动作控制的模态对齐往往难以高效实现,尤其是动作控制环节,受限于离散Tokenizer的精度瓶颈,模型在动作执行的细腻度与准确性上存在明显不足。针对这一问题,智元具身研究中心创新性地提出了一种支持统一离散化预训练的模型架构。该架构通过优化预训练机制,使语义推理与动作控制两大模态能够在统一框架下实现更精准的对齐,从而提升模型的整体性能。

与此同时,研究团队还引入了流匹配(Flow-matching)技术,以缓解传统离散Tokenizer带来的动作精度问题。流匹配技术的运用,使得模型在动作控制方面能够捕捉到更细微的变化,进而提升动作执行的精度与流畅度。这一技术突破不仅为VLA模型的发展开辟了新的路径,也为具身智能领域的进一步探索提供了有力支撑。

据介绍,GenieReasoner作为第二代一体化具身大小脑系统,其设计理念与功能实现均体现了智元具身研究中心在具身智能领域的深厚积累与创新实力。该系统的推出,有望推动VLA模型在更多应用场景中的落地,为智能交互、机器人控制等领域的发展注入新的活力。

更多热门内容