ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

华为“网络+”破局模型:为十万卡智算集群通信瓶颈破局赋能

时间:2025-10-26 15:07:21来源:快讯编辑:快讯

第22届中国计算机大会(CNCC2025)在哈尔滨拉开帷幕,这场以“数智赋能,无限可能”为主题的科技盛会吸引了众多行业目光。华为数据通信产品线研究部部长郑晓龙在会上发表了题为《大模型推理加速与演进:网络如何破局?》的演讲,首次提出“网络+”破局模型,为解决十万卡智算集群面临的通信瓶颈问题提供了全新思路。

郑晓龙指出,在单卡算力提升逐渐放缓的当下,通过跨层协同网络、计算与存储资源,才能将集群效率推向新的高度。华为提出的“网络+”破局模型,正是为了系统化解决超大规模智算集群中的通信难题,为下一代智算基础设施建设提供完整技术路径。

随着DeepSeek推动大模型架构向更稀疏的大EP部署演进,通信模式发生了显著变化,呈现出更强的随机性和非对称性。华为通过引入网络级负载均衡技术,成功应对了这一挑战,使通信性能提升超过20%,同时显著降低了P99完成时间。

当前,大模型应用正从聊天式的Chat LLM向具备自主决策能力的Agentic AI转型,对token生成速度的要求从50ms提升至10ms以下。这一转变带来了诸多挑战:推理阶段以小消息通信为主,控制面时延占比高;若单纯卸载控制面,又会消耗计算资源SM。为此,华为推出了CloudMatrix384超节点及配套的超节点网络,为满足极致的TPOT需求提供了解决方案。

在多模态大语言模型(LMM)流量混战的背景下,华为强调“网络+”并非简单的带宽升级,而是要让网络成为AI集群的“第七代算力”。通过智能化的网络调度策略,华为成功提升了推理性能,实现了“四两拨千斤”的效果。

演讲最后,郑晓龙呼吁业界共同参与标准建设,与合作伙伴及行业组织携手,共同定义大模型时代的下一代智算网络接口,推动整个行业向更高水平发展。

更多热门内容