ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

英伟达Cosmos-Reason1模型:让AI“看懂”物理世界的新突破

时间:2025-05-21 15:25:27来源:ITBEAR编辑:快讯团队

英伟达近期揭晓了其革命性的Cosmos-Reason1系列模型,这一创新之举旨在强化人工智能在物理常识理解和具身推理方面的能力。尽管人工智能在语言处理、数学运算以及代码生成等领域已展现出非凡的进步,但如何将这些成就无缝对接至物理环境,依然是当前科技界面临的一大难题。

与传统人工智能不同,物理AI(Physical AI)侧重于通过视频等感官输入,结合现实世界的物理法则来生成相应的反应。这一领域的应用广泛,涵盖了机器人技术、自动驾驶汽车等多个重要方面,要求AI系统具备强大的常识推理能力,以及对空间、时间和物理规律的深刻洞察。

然而,当前的人工智能模型在物理世界的实际应用中仍存在明显短板,尤其是在直观理解重力、空间关系等物理现象方面表现欠佳,这严重限制了它们在执行具体身体任务时的效能。直接在物理环境中进行AI训练不仅成本高昂,还伴随着巨大的风险,这无疑成为了物理AI发展的绊脚石。

为了突破这一瓶颈,英伟达推出了Cosmos-Reason1模型,这一模型包含了Cosmos-Reason1-7B和Cosmos-Reason1-56B两个版本,通过物理AI监督微调和强化学习两大阶段进行训练。研究团队引入了独特的双本体系统,其中一个分层本体将物理常识细分为空间、时间和基础物理三个部分,另一个本体则专注于映射人类、机械臂和人形机器人等具身代理的推理能力。

Cosmos-Reason1模型采用了仅解码器的大型语言模型架构,并结合视觉编码器来处理视频数据,从而实现了文本和视觉信息的同步推理。为了验证模型的性能,研究团队精心构建了针对物理常识和具身推理的基准测试集,包括604个问题和426个视频的物理常识基准测试,以及包含610个问题和600个视频的六个具身推理基准测试。

经过严格训练,Cosmos-Reason1模型在物理常识和具身推理基准测试中展现出了卓越的表现,特别是在强化学习训练阶段后,模型在预测后续行动、验证任务完成状态以及评估物理可行性等方面取得了显著成果。这一系列的突破为英伟达在物理推理任务中提供了新的解决方案,也为机器人和自动驾驶等领域的发展注入了新的活力。

更多热门内容