在图形处理与人工智能领域的交汇点上,英伟达再次展现了其创新实力。近日,全球图形顶级盛会SIGGRAPH 2025拉开了帷幕,英伟达借此机会发布了一系列重磅新品和技术更新,为物理AI和机器人技术注入了新的活力。
本次发布的亮点之一是NVIDIA Cosmos世界基础模型的全新升级。这款模型包含了一个拥有70亿参数的推理视觉语言模型——NVIDIA Cosmos Reason。这一突破性的进展意味着机器人和视觉AI agents将能够像人类一样,利用先验知识、物理理解和常识进行推理。Cosmos Transfer-2模型能够加速从3D仿真场景或空间控制输入中生成逼真的合成数据,进一步提升了AI训练的效率。
硬件方面,英伟达推出了两款全新的工作站GPU——NVIDIA RTX PRO 4000 Blackwell SFF和NVIDIA RTX PRO 2000 Blackwell。这两款GPU采用了先进的第四代RT Core和第五代Tensor Core,功耗更低,体积更小巧,仅为传统GPU的一半大小。RTX PRO 4000 SFF在AI性能、光线追踪性能和带宽方面均实现了显著提升,而RTX PRO 2000则针对主流设计和AI工作流程进行了优化,提高了3D建模、计算机辅助设计、渲染和图像生成的速度。
英伟达还推出了RTX PRO服务器系列,专为运行复杂AI推理模型的企业工作负载而设计。这些服务器支持多个NVIDIA RTX PRO 6000 Blackwell GPU,能够加速Agentic AI、内容创作、数据分析、图形、科学模拟、工业和物理AI等多种应用场景。思科、戴尔科技、HPE、联想和超微等厂商将提供搭载这款GPU的新型2U主流服务器。
在软件层面,英伟达推出了全新的NVIDIA Omniverse软件开发套件(SDK)和库,为构建和部署工业AI和机器人模拟应用提供了强大的工具。新Omniverse SDK实现了MuJoCo(MJCF)和通用场景描述(OpenUSD)之间的数据互操作性,使得MJCF机器人学习开发者能够无缝模拟各平台的机器人。同时,Omniverse NuRec库和AI模型引入了RTX光线追踪3D高斯溅射(3DGS)技术,帮助开发者以3D形式捕捉、重建和模拟现实世界。
英伟达还宣布了NVIDIA Metropolis平台的五项关键更新,旨在简化视频分析AI agents和服务的开发、部署和扩展。这些更新包括Cosmos Reason VLM的集成,用于增强视觉AI应用的VSS Blueprint 2.4,以及一套全新的视觉基础模型和高级微调方法。NVIDIA Isaac Sim的扩展工具将帮助开发者解决标注数据有限和罕见边缘场景等挑战,加速AI在现实条件下的性能提升。
英伟达的研究人员在SIGGRAPH上还展示了模拟、AI渲染和3D内容生成方面的最新进展。其中一项研究探讨了从2D图像或视频重建物理感知3D几何体的挑战,并提出了一种确保生成的3D形状能够真实还原现实世界物理特性的方法。另一项研究则介绍了一种通过物理上精确的运动赋予模拟角色生命的技术,为开发虚拟角色或训练现实世界的人形机器人提供了逼真的合成数据。
英伟达正通过一系列软硬件基础设施的推出,为物理AI和机器人工作负载提供强大的动力。随着这些技术的不断发展和应用,我们有理由相信,未来的机器人和AI系统将更加智能、高效和适应性强,为各行各业带来深刻的变革。