ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

华为昇腾384超节点:算力媲美英伟达,通信带宽大飞跃!

时间:2025-05-27 21:25:38来源:ITBEAR编辑:快讯团队

在华为近期举办的昇腾AI开发者峰会上,一项重大的技术创新引起了业界的广泛关注。华为昇腾计算业务总裁张迪煊向与会者隆重介绍了昇腾384超节点架构,这一基于昇腾人工智能处理器的高性能计算架构,被誉为中国版的英伟达NVL72系统,为解决数据中心瓶颈问题提供了新的思路。

随着大数据和人工智能技术的飞速发展,传统的服务器架构在并行处理规模不断扩大的背景下,其跨机带宽逐渐成为制约训练效率的关键因素。张迪煊在会上指出,为了满足未来日益增长的训练需求,创新计算架构如昇腾384超节点显得尤为重要。

昇腾384超节点架构是华为此前公布的CloudMatrix 384系统的基础。该系统由384颗昇腾AI处理器组成,包含12个计算柜和4个总线柜,最大算力可达惊人的300 PFLOPS,并配备了48TB的高速内存。这一架构不仅实现了业界最大规模的昇腾384卡超节点,还已在安徽、内蒙古和贵州等地的数据中心成功部署。

华为表示,多个昇腾384超节点可以进一步组成十万卡级的Atlas 900 SuperCluster超节点集群,以满足更大规模的模型训练需求,加速各行各业的智能化和高效化进程。这一创新架构打破了以CPU为中心的冯诺依曼架构,提出了对等计算架构的新理念。在超节点内部,高速总线互联取代了传统的以太网,通信带宽提升了15倍,单跳通信时延也降低了10倍,从2微秒缩短至200纳秒。

值得注意的是,昇腾384超节点架构在处理当前主流的Mixture-of-Experts(MoE)模型时展现出了卓越的性能。MoE模型以其优异的模型效果成为主要模型结构,但其混合并行策略却极为复杂,涉及大量的通信量。华为公布的基准测试结果显示,在处理meta的LLama 3等密集型AI模型时,昇腾384超节点的单卡性能达到了132 tokens/秒(TPS),是传统集群的2.5倍。对于Qwen以及DeepSeek等通信密集型多模态及MoE模型,华为架构的单卡性能更是高达600至750 TPS,实现了3倍以上的性能提升。

虽然华为尚未明确透露其新计算架构下具体使用的是哪款昇腾芯片变体,但据SemiAnalysis的一份报告透露,CloudMatrix 384系统采用了最新的昇腾910C AI处理器。这款处理器通过规模优势来弥补单个芯片性能的不足,从而在整体性能上实现了显著提升。

在峰会上,华为还分享了CATLASS算子模板库、MindIE Motor推理服务加速库以及持续升级的分层开放CANN能力等内容。这些举措旨在为开发者提供更加便捷的开发环境,提升模型训练与推理效率,进一步推动产业生态的共建与发展。

SemiAnalysis的报告指出,尽管华为在芯片领域相对于西方企业落后一代,但其扩展解决方案却领先了英伟达和超微半导体(AMD)的当前市场产品一代。这一评价无疑是对华为在AI计算领域创新能力的肯定。

在全球AI算力竞赛日益激烈的背景下,华为的创新不仅为解决数据中心瓶颈问题提供了中国方案,更有望重塑下一代AI模型训练的底层逻辑。通过不断的技术创新,华为正在算力规模与能效比之间寻找新的平衡点,推动AI技术从实验室走向更广泛的产业应用,为全球AI产业的发展贡献中国智慧和力量。

更多热门内容
阿里“复兴”之路:效率改善后,扩张新篇章何时奏响?
一个高速扩张的平台其前提必然是有强大的流量采买能力,主要体现在市场费用的消耗上(无论从业务模式还是规模比重,阿里的市场费用大头主要是花在淘天),2022年之前,此部分市场费用都是剧烈扩张的,与前文中资本开支…

2025-05-27

快手一季度营收增10.9%,日活破4亿,可灵AI商业化加速领跑
快手发布的2025年一季度财报显示,营收326亿元,同比增长10.9%,经调整净利润46亿元,同比增长4.4%。快手应用的平均日活跃用户数再次突破历史新高达4.08亿。本季度,可灵AI在持续迭代保持技术全球领…

2025-05-27

SAP牵手阿里巴巴,共绘AI赋能数字化转型新蓝图
5月27日,阿里巴巴集团与SAP宣布达成战略合作,将SAP行业领先的企业级软件与阿里云基础设施及AI能力结合,加速企业客户的创新和数字化转型。阿里巴巴集团还将部署SAP商业AI、SAP业务技术云平台(BTP)…

2025-05-27