ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

英伟达CES 2026发布两款桌面AI超算,DGX Station可本地运行万亿参数模型

时间:2026-01-06 14:26:03来源:ITBEAR编辑:快讯

在近期举办的CES 2026展会上,英伟达正式推出两款桌面级AI超级计算机——DGX Spark与DGX Station,标志着本地AI开发正式迈入"超算时代"。这两款设备基于全新NVIDIA Grace Blackwell架构打造,通过集成大容量统一内存与Petaflop级算力,为开发者提供了无需依赖云端集群的本地化解决方案。

针对不同规模的开发需求,两款设备形成差异化定位。定位入门级的DGX Spark专为千亿参数模型优化,其创新的NVFP4数据压缩技术可在保持模型智能表现的前提下,将存储需求降低70%。在视频生成场景测试中,该设备运行Black Forest Labs的FLUX.2模型时,较搭载M4 Max芯片的顶级MacBook Pro快8倍。通过与llama.cpp等开源社区的深度协作,DGX Spark在运行SOTA模型时平均性能提升35%,大语言模型加载速度显著加快。

面向企业级应用的DGX Station则展现出更强大的计算能力。配备GB300 Grace Blackwell Ultra超级芯片与775GB FP4精度一致性内存,该设备可本地运行万亿参数规模的巨型模型。其采用的NVLink-C2C或PCIe Gen6/7互连技术,通过硬件级数据同步架构实现CPU与GPU间的零拷贝数据传输,将延迟控制在极低水平。FP4精度格式通过1位符号、2位指数、1位尾数的E2M1布局设计,在维持模型精度的同时,将显存占用压缩至FP16格式的四分之一,吞吐量提升2-3倍。

英伟达公布的模型支持清单显示,DGX Station可兼容Kimi-K2 Thinking、DeepSeek-V3.2、Mistral Large 3等前沿架构。vLLM核心维护者Kaichao You指出,该设备使研发团队能够以极低成本测试GB300专属特性,显著提升开发效率。在软件生态建设方面,DGX Spark已集成NVIDIA AI Enterprise软件栈,并针对机器人控制、基因组分析、金融建模等领域推出专项开发手册。

硬件供应方面,DGX Spark将通过戴尔、惠普、联想、华硕等合作伙伴的GB10系统即刻发售,而旗舰级DGX Station计划于年内晚些时候正式上市。这两款设备的推出,不仅重新定义了桌面级AI计算的性能边界,更为从原型开发到规模化部署的全流程提供了无缝衔接的解决方案。

更多热门内容
全自主运营!越疆人形机器人影院“上岗” 14小时零失误售卖爆米花
越疆机器人官网显示,该公司的人形机器人名为Atom,宣称是全球首款“灵巧操作+直膝行走”具身智能人形机器人。 公开资料显示,H2是宇树科技于去年10月发布的新一代机器人,其搭载31个高自由度关节,腿部7个专…

2026-01-06

2026AI智能体营销新蓝图:从工具到伙伴,重构商业生态与营销范式
其核心优势在于“大脑+手”的协同结构,能自主拆解复杂任务、调用外部工具,实现从“生成”到“执行”的质变,重构人机协作模式,催生“按结果付费”的新商业模式。在生产力跃迁、流程决策重构、生态竞争升级三大维度,AI…

2026-01-06

光峰科技CES 2026展三款LCoS AR光机,以创新推动消费级AR眼镜普及浪潮
光峰科技的战略精准契合了消费级市场对“高性能+高性价比”的核心需求,为技术快速落地奠定基础。其中,蜻蜓G1采用独特的“单光机驱动双目显示”方案,单目体积仅0.35cc,可直接适配主流AR眼镜形态设计。 值得…

2026-01-06