ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

英伟达Jim Fan领衔30人团队:物理图灵测试攻坚路,自曝教训押注世界模型

时间:2026-01-11 11:36:17来源:快讯编辑:快讯

英伟达正以一套完整的技术栈,向机器人领域的终极挑战——物理图灵测试发起全面冲击。由杰出科学家Jim Fan领导的GEAR实验室,在机器人学习领域取得了一系列突破性进展,其成果不仅覆盖了从基础模型到仿真训练的完整技术链条,更在多个关键维度上重新定义了行业标杆。

在基础模型构建方面,GEAR实验室提出的GR00T体系已成为行业焦点。这个通用机器人基础模型通过将视觉、语言和动作三种模态统一到一个端到端架构中,使机器人具备了跨场景任务迁移能力。今年内该模型已完成三次迭代升级:3月开源的N1版本仅用20亿参数就验证了架构可行性;6月发布的N1.5通过引入Eagle视觉语言模型和FLARE损失函数,显著提升了动作预测一致性;12月最新推出的N1.6则集成了更强的推理架构,在复杂环境中的表现更加稳健。实验数据显示,在10个新环境和22种新行为测试中,基于GR00T训练的机器人均展现出优秀的泛化能力。

仿真训练领域的技术突破同样引人注目。实验室开发的DreamGen框架通过构建"数字梦境"生成海量虚拟训练数据,使机器人能够从单个动作示例中快速学习新技能。在运动控制方面,SONIC系统通过超大规模运动追踪训练(9000+GPU小时,超1亿动作帧),让人形机器人掌握了稳定跟踪人类动作的能力,为构建通用运动基础系统提供了关键支撑。更值得关注的是VIRAL框架,该系统仅依赖RGB视觉输入,就在Unitree G1机器人上实现了54次连续操作循环的零样本真实世界迁移,创造了行业新纪录。

在强化学习领域,PLD训练范式通过引入残差强化学习机制,使机器人在真实环境中能够自我纠错和持续改进。该技术将现场学习到的改进经验蒸馏回主模型,解决了工业部署中的"最后一公里"难题。实验表明,经过PLD优化的机器人在GPU插入等高精度任务中,成功率已接近100%。另一项突破性成果DoorMan策略则完全在仿真环境中训练,仅用RGB视觉输入就实现了复杂开门任务,其性能甚至超越人类遥操作员。

尽管取得显著进展,Jim Fan坦言机器人领域仍面临诸多挑战。他特别指出三个关键瓶颈:前沿硬件的可靠性严重制约软件迭代速度,行业缺乏统一的基准测试标准,以及现有视觉语言模型架构与物理世界交互需求存在根本性错配。针对这些问题,GEAR实验室已将视频世界模型作为核心研究方向,这种能直接生成可交互未来的神经物理引擎,被视为突破当前局限的关键路径。实验室正在构建的Physical API基础设施,更预示着机器人技能分发模式的革命性变革。

更多热门内容