人形机器人新突破！WholeBodyVLA框架实现行走操作协同，验证全身控制可行路径-业界动态-ITBear科技资讯

在具身智能领域，让双足人形机器人像人类一样完成装箱、搬运、推车等移动操作任务，始终是科研人员努力的方向。近期，由香港大学、智元AGIBOT、复旦大学以及上海创智学院组成的联合研究团队，取得了一项重要成果——提出WholeBodyVLA框架，为双足人形机器人的自主全身控制开辟了新路径。

该研究基于智元灵犀X2展开，将视觉语言动作模型（VLA）拓展至双足人形机器人的全身控制范畴，并成功验证了其在全身移动操作任务中的可行性。与原地操作不同，移动操作面临更为复杂的挑战。其难点并非掌握单一技能，而是要求行走与操作在同一任务中长时间、稳定地协同进行。

围绕这一难题，WholeBodyVLA框架总结出制约移动操作发展的两大核心问题：真机数据稀缺以及运动执行过程中的不稳定性。在人形机器人执行移动操作任务时，数据采集的难度和成本远高于原地操作。通常需要多名数采员同时协作，通过遥操让机器人上半身进行操作、下半身完成行走。这一过程往往借助混合方案实现，比如用VR控制上半身、遥控器控制下半身，但这种方式操作流程繁琐、效率低下；若采用全身动捕系统，又会面临高昂的价格。

同时，移动操作对运动精准性和稳定性的要求极高。与单纯的操作相比，任何细微的偏差都可能使目标操作物体脱离相机视野和工作空间。即便VLA输出了正确的运动指令，下半身控制器仍可能出现执行失误，例如走歪、踉跄等情况。

为攻克这些难题，研究团队在WholeBodyVLA框架中引入了两项关键创新。一方面，从人类视频中学习移动与操作的潜在动作。该框架通过第一视角的人类视频学习相关动作，其中操作相关的潜在动作基于AgiBot World数据集进行建模。另一方面，设计了面向移动操作的强化学习（RL）控制器。将通用连续运动控制目标简化为一组离散运动指令，仅保留移动操作必要的强化学习训练目标，从而大幅提升控制器在运动执行时的稳定性。

研究团队在智元灵犀X2人形机器人上开展了大量真机实验。实验结果表明，WholeBodyVLA框架使机器人具备了大范围、长程移动操作任务的能力，在距离、操作和地形等方面都展现出良好的泛化性。

AI智能体小程序选型指南：从技术到场景，如何找到靠谱解决方案

以某厂商的解决方案为例（即提供人工智能体科技服务的企业），其预设模板覆盖零售、教育、金融等10余个行业，支持非技术人员通过拖拽式编排器在30分钟内搭建一个具备标准知识库与对话策略的智能体。对于场景较单一、数据…

2026-06-29

高通机器人战略全解析：System 0、1、2架构如何赋能物理AI新未来？

芯片架构复用率越高，研发摊薄越充分，成本优势越明显，在三个行业里卖的"芯片"形态可以完全不同（汽车是SoC加ADAS加速器，工业是边缘AI盒子，机器人是IQ10参考设计），但底层跑的都是同一套Oryon CP…

2026-06-29

智元第15000台具身智能机器人下线引领具身智能产业化新征程

智元15000台机器人量产下线，标志着中国具身智能整机制造正式迈入规模化量产新阶段，彻底完成从实验室原型、小批量试点到工业化批量交付的跨越，夯实了国产人形机器人在全球赛道的产业化先发优势，带动上下游供应链、…

2026-06-29

对话旷行科技舒江鹏：具身智能如何突破高危场景壁垒，机器人下矿还有多远？

但由于现在市场上已经有不少成熟的机器人本体产品，所以我们目前研发的重点并不是本体，而是它上面的“大脑”。搜狐科技：很多机器人在实验室里能跑通，但真正到了矿山、隧道这些复杂环境后，往往容易失效，这是为什么？ …

2026-06-29

国内首批智能体标准落地，AI应用加速场景化，云计算与算力企业迎发展新机遇

云计算ETF易方达（516510）跟踪的中证云计算与大数据主题指数，覆盖通信设备、算力租赁、云服务等核心环节，是智能体落地的基础设施载体。智能体国家标准的发布标志着AI应用正从技术验证走向规模化落地，云计算和…

2026-06-29

智元第15000台具身机器人量产下线，人形机器人规模化商业应用加速推进

智元机器人公司宣布其第15000台通用具身机器人正式量产下线，距离万台下线不到3个月。智元机器人第15000台量产下线验证了具身机器人规模化生产的可行性，核心零部件产业链有望在机器人量产浪潮中持续受益，产业…

2026-06-29

从Coffee Chat到黑客松：科技圈线下社交如何构建深度价值网络？

2026-06-29

猪价磨底期，牧原股份降本增效，养猪业开启成本效率新赛程

2026-06-29

Flourish豪掷25亿美金：类脑计算能否终结AI能耗困局？

2026-06-29

索康尼：从专业跑圈“劳斯莱斯”到中产新宠的逆袭之路

2026-06-29