英伟达(Nvidia)近日披露了其下一代GPU架构的研发进展,宣布名为Vera Rubin的微架构已进入深度开发阶段,并计划于2026年正式投入市场。该架构的核心产品Rubin CPX变体将聚焦于支持超大规模上下文窗口的AI计算任务,为复杂场景提供硬件支撑。
据英伟达首席执行官黄仁勋介绍,Vera Rubin平台将推出两款关键产品:下一代Rubin GPU以及专为长上下文处理设计的CPX处理器。其中,Rubin CPX特别针对需要处理百万级token的应用场景优化,例如高精度视频生成和大型软件开发项目。该处理器的性能指标显示,其AI计算能力可达8exaflops,上下文计算性能为30PF NVFP4,指数运算效率较现有GB300NVL72系统提升三倍。
硬件配置方面,Rubin CPX GPU搭载128GB GDDR7内存,配备4个专用编码器和4个解码器模块,可支持生成式视频任务的实时处理。其快速内存容量扩展至100TB,能够满足超大规模AI模型对数据吞吐的需求。英伟达透露,Vera Rubin NDL144CPX型号将于2026年底启动量产,成为首批搭载该架构的商用产品。
在数据中心领域,英伟达同步宣布将推出千兆级参考设计方案,旨在重构超大规模AI基础设施。该方案涵盖建筑布局、系统设计、模拟测试及运营优化等全流程,通过与基础设施供应商的深度协作,为AI工厂提供标准化技术框架。英伟达高管指出,此举将加速下一代AI计算中心的部署效率。
在技术验证层面,英伟达同步公布了MLPerf推理基准测试的最新成果。其Blackwell架构GPU在测试中打破多项纪录,尤其在处理Llama3.1405B交互模型时展现出显著优势。值得注意的是,英伟达提出的“解耦服务”技术通过优化硬件资源分配,使现有系统的性能得到进一步提升,为已部署相关方案的企业创造了额外收益空间。