在近期举办的2025 OCP全球峰会上,英特尔推出了一项突破性的技术方案——将自身研发的Gaudi3 AI加速器与英伟达B200 Tensor Core GPU整合到同一计算框架中,构建出一种跨厂商的异构AI系统。这一设计打破了传统硬件方案中依赖单一供应商的局限,为AI计算领域提供了新的思路。
据技术方案披露,该系统通过分工协作优化了计算效率:英伟达B200 GPU负责AI模型的预填充任务,而计算密集型的解码环节则由英特尔Gaudi3加速器承担。这种分工方式充分利用了不同硬件的核心优势,实现了计算资源的精准匹配。
在Llama开源大模型的性能测试中,该异构系统展现出显著优势。与纯英伟达B200组成的同构系统相比,在总体拥有成本(TCO)相同的情况下,新方案实现了最高70%的性能提升。这意味着用户可以用相同的投入获得近一倍的算力输出,大幅提升了计算资源的利用率。
外媒SemiAnalysis进一步披露了该系统的硬件构成细节。除了核心的计算芯片外,系统还集成了英伟达的ConnectX-7 400GbE高速网卡、BlueField-3 DPU数据处理单元,以及博通研发的Tomahawk5 51.2Tb/s交换芯片。这些高端网络组件的加入,为系统提供了强大的数据传输能力。
通过这些网络组件的协同工作,系统构建了一个高扩展性的计算环境。在多芯片并行运算的场景下,数据传输效率得到显著提升,确保了不同硬件之间的无缝协作。这种设计不仅优化了系统性能,也为未来更大规模的AI计算需求预留了扩展空间。
更多关于AI技术的最新资讯,可访问专业网站:http://www.aipress.com.cn/