ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

人形机器人新突破!WholeBodyVLA框架实现行走操作协同,验证全身控制可行路径

时间:2025-12-18 21:54:15来源:快讯编辑:快讯

在具身智能领域,让双足人形机器人像人类一样完成装箱、搬运、推车等移动操作任务,始终是科研人员努力的方向。近期,由香港大学、智元AGIBOT、复旦大学以及上海创智学院组成的联合研究团队,取得了一项重要成果——提出WholeBodyVLA框架,为双足人形机器人的自主全身控制开辟了新路径。

该研究基于智元灵犀X2展开,将视觉语言动作模型(VLA)拓展至双足人形机器人的全身控制范畴,并成功验证了其在全身移动操作任务中的可行性。与原地操作不同,移动操作面临更为复杂的挑战。其难点并非掌握单一技能,而是要求行走与操作在同一任务中长时间、稳定地协同进行。

围绕这一难题,WholeBodyVLA框架总结出制约移动操作发展的两大核心问题:真机数据稀缺以及运动执行过程中的不稳定性。在人形机器人执行移动操作任务时,数据采集的难度和成本远高于原地操作。通常需要多名数采员同时协作,通过遥操让机器人上半身进行操作、下半身完成行走。这一过程往往借助混合方案实现,比如用VR控制上半身、遥控器控制下半身,但这种方式操作流程繁琐、效率低下;若采用全身动捕系统,又会面临高昂的价格。

同时,移动操作对运动精准性和稳定性的要求极高。与单纯的操作相比,任何细微的偏差都可能使目标操作物体脱离相机视野和工作空间。即便VLA输出了正确的运动指令,下半身控制器仍可能出现执行失误,例如走歪、踉跄等情况。

为攻克这些难题,研究团队在WholeBodyVLA框架中引入了两项关键创新。一方面,从人类视频中学习移动与操作的潜在动作。该框架通过第一视角的人类视频学习相关动作,其中操作相关的潜在动作基于AgiBot World数据集进行建模。另一方面,设计了面向移动操作的强化学习(RL)控制器。将通用连续运动控制目标简化为一组离散运动指令,仅保留移动操作必要的强化学习训练目标,从而大幅提升控制器在运动执行时的稳定性。

研究团队在智元灵犀X2人形机器人上开展了大量真机实验。实验结果表明,WholeBodyVLA框架使机器人具备了大范围、长程移动操作任务的能力,在距离、操作和地形等方面都展现出良好的泛化性。

更多热门内容
太空光伏崛起:低轨赛道如何重塑能源与算力新格局?
光伏技术路线也在分化:砷化镓凭借高效率占据高端市场,硅基异质结(HJT)与钙钛矿叠层技术则以成本优势瞄准大规模应用。这种高密度的发射计划,直接催生了对卫星制造产业链的爆发式需求,其中电源系统作为卫星的“心脏”…

2026-01-11

FCC批准SpaceX再部署7500颗二代“星链”卫星 提升全球网络服务能力
根据FCC的要求,SpaceX必须在2028年12月1日之前发射获批第二代卫星总量的50%,并将其送入指定轨道,投入运行;剩余卫星必须在2031年12月之前发射。 1月1日,“星链”方面称,计划在2026年…

2026-01-11