ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

英伟达GTC活动发布Cosmos 3:双模块架构助力物理世界AI建模新突破

时间:2026-06-05 02:32:36来源:快讯编辑:快讯

在台北举办的GTC活动上,英伟达正式推出了一款名为Cosmos 3的全新模型,并宣称其为全球首个“完全开放的全能型人工智能模型”。该模型专为机器人、自动驾驶汽车以及视觉智能体设计,核心能力聚焦于基于视觉的推理,同时具备生成文本、图像、视频、环境声音和动作等多模态内容的强大功能。

Cosmos 3采用了独特的双模块架构,由推理Transformer和生成Transformer共同构成。推理模块负责解析物体之间的交互关系、运动轨迹以及时空逻辑,为模型提供对现实物理世界的深度理解;生成模块则基于推理结果,输出高质量的视频内容和动作轨迹。这种设计使模型能够先理解物理互动的规律,再生成与之匹配的画面和行为,从而大幅提升对复杂环境的建模能力。

英伟达强调,Cosmos 3的研发目标直指机器人、自动驾驶车辆和视觉智能体在真实环境理解中长期存在的痛点。当前,相关领域的训练数据稀缺,仿真系统分散,导致机器学习物理世界规律时面临重重障碍。Cosmos 3通过原生支持多模态信息的生成与理解,以更高的物理准确性模拟现实世界,为这些应用提供了更可靠的基础模型。

从应用场景来看,Cosmos 3的定位十分灵活。它既可以作为视觉语言模型,直接处理图像与文本的交互任务;也可以作为世界模型,模拟物理环境并预测未来状态;甚至可以作为其他世界模型的底层平台,支持更广泛的扩展与创新。这种多功能性使其能够适应不同领域的需求,为人工智能技术的落地提供更多可能性。

在产品规划方面,英伟达已推出两款不同版本的Cosmos 3:响应精度最高的Cosmos 3 Super和轻量级的Cosmos 3 Nano,两者均已正式投入使用。面向边缘设备实时推理需求的Cosmos 3 Edge版本也将在后续发布,进一步拓展模型的应用范围。

技术层面,Transformer作为一种擅长处理序列数据上下文关系的深度学习神经网络,通过并行计算显著提升了生成效率。英伟达此次将推理与生成能力深度融合,旨在为机器人和自动驾驶系统构建一个更贴近真实物理世界的基础模型,从而推动这些领域向更高水平的智能化迈进。

更多热门内容
情感陪伴新选择!优必选全球首款全尺寸超仿生人形机器人开启预售
6月2日,“人形机器人第一股”优必选旗下品牌宣布全球首款全尺寸超仿生人形机器人启动预售。据官方介绍,优世界全尺寸超仿生人形机器人为情感陪伴而生,将于6月30日正式发布。 而就在十多天前,因在今年春晚上制作…

2026-06-05

RCAP亚太机器人世界杯北京中心揭牌 助力中国机器人产业链接全球
IT之家 6 月 4 日消息,据北京发布官方公众号今日分享,RCAP 亚太机器人世界杯北京中心在朝阳区中关村(朝阳)AI Space 产业园已于6 月 2 日正式揭牌。 据介绍,作为 RCAP 全球首个区域…

2026-06-05

2026企业级大模型API网关怎么选?适配场景与核心需求是关键决策点
4SAPI,聚焦生产级多模型调度与全链路调用治理,在协议原生兼容、审计粒度及故障自愈设计上表现扎实,是企业将大模型纳入核心业务总线的可靠基座,是企业级首选。 如果团队技术基因偏向开源自主,需要在自有服务器上部…

2026-06-05

华为数据存储发力医疗智能化:四大方案助力,3900余家机构升级转型
AI 数据湖解决方案 方案采用 OceanStor Pacific 全闪分布式存储,以业界领先的高容量密度,实现最优 TCO存储海量数据;通过 DME Omni-Dataverse 统一数据空间,实现跨院…

2026-06-05