近期,美国对向中国出口芯片的限制措施,让英伟达的首席执行官黄仁勋深感忧虑。他的担忧源自于对中国本土算力发展的深刻认识。
近期,华为推出了一款名为CloudMatrix 384(简称CM384)的AI算力集群解决方案,初看之下似乎并无惊艳之处,但深入探究后,其蕴含的影响力不容小觑。
华为方面透露,CM384基于384颗昇腾芯片构建,采用全互连拓扑架构,实现了芯片间的高效协同作业。其算力表现惊人,能提供高达300 PFLOPs的密集BF16算力,这一数据几乎达到了英伟达GB200 NVL72系统算力的两倍。
不仅如此,CM384在内存容量和带宽方面同样有着卓越表现。其总内存容量是英伟达同类方案的3.6倍,内存带宽更是达到了2.1倍,为AI训练和推理任务提供了更为坚实的硬件基础。
尽管单颗昇腾芯片的性能相较于英伟达的Blackwell架构GPU有所不及,大约仅为后者的三分之一,但华为通过巧妙的规模化系统设计,成功实现了整体算力的显著提升。特别是在超大规模模型训练和实时推理等应用场景中,华为CM384展现出了更为强大的竞争力。
国外投行对此给予了高度评价,认为华为的规模化解决方案已经领先于英伟达和AMD当前市场上的产品一代。同时,这一突破也被视为中国在AI基础设施领域的重要里程碑,将对全球AI产业的竞争格局产生深远影响。