第八届虹桥国际经济论坛期间,两场聚焦人工智能与机器人产业的高端对话在国家会展中心(上海)同步展开。在“人形机器人创新发展合作”分论坛上,凭借春晚扭秧歌表演引发关注的宇树科技创始人王兴兴,与在“人工智能产业高质量发展”分论坛亮相的智元机器人团队,通过不同会场的观点碰撞完成了行业层面的深度交流。
王兴兴在发言中坦言,尽管预测今年国内智能机器人企业平均增速将达50%-100%,但行业核心技术突破仍面临瓶颈。他特别指出,具身智能大模型的发展速度略低于预期,“虽然全身运动控制的深度强化学习取得显著进步,但大模型的技术迭代仍需加速”。这位技术领军者以ChatGPT为类比,认为当前行业正处于技术爆发前夜,“当机器人能在80%的陌生场景中,通过语音指令完成80%的任务时,才算真正迎来具身智能的临界点”。
针对技术突破路径,王兴兴提出具体场景设想:若明年此时,未经预训练的机器人能在完全陌生的环境中,根据自然语言指令完成递送物品等任务,且成功率达到80%,则标志着技术实现质的飞跃。他同时强调,单纯扩大模型规模或数据采集量并非最优解,“模型架构创新与数据质量提升需要同步推进,这已成为全球性技术难题”。
在另一场分论坛中,智元机器人合伙人姚卯青揭示了企业的全栈技术布局。这家成立仅两年的初创企业,已构建起“本体-数据-模型-场景”四维驱动的创新体系。姚卯青特别指出,机器人产业的数据需求与互联网存在本质差异,“动作类、长程规划类数据的稀缺性,使得行业面临‘数据荒漠’的挑战”。
为破解数据困局,智元采取双轨策略:一方面于2024年底开源百万级真机数据集AgiBot World,通过多轮审核确保数据质量;另一方面创新采集方式,引入“对抗式采集”提升数据密度,开发“自主进化式采集”解决长尾场景问题。这些创新使智元在具身智能算法领域实现多项突破,其GO-1基座模型已在生活、零售、工业场景中通过验证。
在模型研发层面,智元的世界模型GenieEnvisioner展现出独特优势。该模型遵循“生成理解一体化”理念,能够模拟物理环境变化并预判行为后果。演示视频显示,搭载该模型的机器人可连续完成制作三明治、倒茶、装箱等复杂任务。基于这项技术,智元最新发布的工业机器人精灵G2已斩获数亿元订单,将在柔性制造和物流分拣领域开启商用。
值得关注的是,两家企业虽技术路径各异,却都指向具身智能的终极目标。宇树科技侧重模型架构创新,强调在陌生场景中的泛化能力;智元机器人则通过数据闭环和世界模型构建,推动机器人向类人智能演进。这种技术路线的差异化探索,正推动中国机器人产业形成协同创新的良好生态。

