国内具身智能领域近日取得里程碑式进展——北京人形机器人创新中心正式开源国内首个通过具身智能国家标准测试的视觉-语言-动作(VLA)大模型XR-1。这一突破性成果标志着我国人形机器人技术从实验室验证阶段迈向真实场景应用的关键转折点,为机器人产业规模化落地提供了核心支撑。
作为具身智能系统的"小脑"模块,XR-1大模型展现出强大的跨平台适配能力。基于超百万量级的自研多本体数据训练,该模型可在天工2.0、UR、Franka等不同构型机器人平台上无缝迁移通用操作知识。在七大泛化维度测试中,XR-1对物体颜色、空间位置、背景干扰等复杂场景表现出优异适应性,能够精准完成取放、推拉、旋转等双臂协同操作任务,动作精度达到行业领先水平。
与XR-1同步开源的还有两大核心基础设施:新一代数据底座RoboMIND2.0和高保真数字资产库ArtVIP最新版。这套组合方案构建起完整的"数据采集-模型训练-场景验证"闭环体系,其中RoboMIND2.0支持多模态数据实时处理,ArtVIP则提供超过50万帧的精细化场景数据,涵盖工业制造、物流搬运、家庭服务等20余个典型应用场景。
在系统架构层面,创新中心已形成"大脑+小脑+本体"的完整生态布局。物理本体层依托"具身天工"平台,已迭代出天工2.0、天轶2.0等系列化机器人产品;具身大脑层通过"慧思开物"平台先后开源WoW世界模型和Pelican-VL大模型,承担环境感知、任务规划等高层认知功能;此次发布的XR-1小脑模型则专注于运动控制,实现从决策到执行的精准转化。
