Nvidia推出Rubin CPX GPU：2026年上市，为“海量上下文”AI应用提供强劲算力支持-业界动态-ITBear科技资讯

英伟达（Nvidia）近日披露了其下一代GPU架构的研发进展，宣布名为Vera Rubin的微架构已进入深度开发阶段，并计划于2026年正式投入市场。该架构的核心产品Rubin CPX变体将聚焦于支持超大规模上下文窗口的AI计算任务，为复杂场景提供硬件支撑。

据英伟达首席执行官黄仁勋介绍，Vera Rubin平台将推出两款关键产品：下一代Rubin GPU以及专为长上下文处理设计的CPX处理器。其中，Rubin CPX特别针对需要处理百万级token的应用场景优化，例如高精度视频生成和大型软件开发项目。该处理器的性能指标显示，其AI计算能力可达8exaflops，上下文计算性能为30PF NVFP4，指数运算效率较现有GB300NVL72系统提升三倍。

硬件配置方面，Rubin CPX GPU搭载128GB GDDR7内存，配备4个专用编码器和4个解码器模块，可支持生成式视频任务的实时处理。其快速内存容量扩展至100TB，能够满足超大规模AI模型对数据吞吐的需求。英伟达透露，Vera Rubin NDL144CPX型号将于2026年底启动量产，成为首批搭载该架构的商用产品。

在数据中心领域，英伟达同步宣布将推出千兆级参考设计方案，旨在重构超大规模AI基础设施。该方案涵盖建筑布局、系统设计、模拟测试及运营优化等全流程，通过与基础设施供应商的深度协作，为AI工厂提供标准化技术框架。英伟达高管指出，此举将加速下一代AI计算中心的部署效率。

在技术验证层面，英伟达同步公布了MLPerf推理基准测试的最新成果。其Blackwell架构GPU在测试中打破多项纪录，尤其在处理Llama3.1405B交互模型时展现出显著优势。值得注意的是，英伟达提出的“解耦服务”技术通过优化硬件资源分配，使现有系统的性能得到进一步提升，为已部署相关方案的企业创造了额外收益空间。

​Nvidia推出Rubin CPX GPU：2026年上市，为“海量上下文”AI应用提供强劲算力支持

Nvidia推出Rubin CPX GPU：2026年上市，为“海量上下文”AI应用提供强劲算力支持