ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

华为“网络+”破局模型亮相CNCC2025,为十万卡智算集群通信瓶颈破局

时间:2025-10-26 15:02:15来源:快讯编辑:快讯

第22届中国计算机大会在哈尔滨拉开帷幕,这场以“数智赋能,无限可能”为主题的科技盛会吸引了众多行业目光。在大会现场,华为数据通信产品线研究部部长郑晓龙发表了题为《大模型推理加速与演进:网络如何破局?》的精彩演讲,首次提出“网络+”破局模型,为十万卡智算集群面临的通信难题带来了创新性的解决方案。

郑晓龙在演讲中指出,当下单卡算力的提升速度逐渐放缓,要实现集群效率的飞跃,必须依靠网络、计算与存储的跨层协同。基于此,华为提出了“网络+”破局模型,旨在系统性地攻克超大规模集群中的通信瓶颈问题。该模型从架构设计、协议优化以及调度策略等多个维度展开,为构建下一代智算基础设施勾勒出完整的技术路线。

随着DeepSeek推动大模型架构向更稀疏的大EP部署转变,通信模式和关系发生了显著变化,呈现出随机性和非对称性的特点。为应对这一挑战,华为推出了网络级负载均衡技术。该技术能够有效应对大EP部署带来的动态通信模式难题,将通信性能提升超过20%,同时显著降低P99完成时间,为智算集群的高效运行提供了有力保障。

大模型应用的发展趋势也在不断变化,从聊天式的Chat LLM向Agentic AI演进,对token生成速度的要求从50ms大幅提升至10ms以下。然而,当前部署实践面临诸多挑战,推理阶段以小消息通信为主,控制面时延占比过高;若单纯卸载控制面,又会消耗计算资源SM。针对这些问题,华为推出了CloudMatrix384超节点及对应的超节点网络,为满足极致的TPOT需求提供了可能,助力大模型应用在新的发展阶段实现更高效运行。

在多模态LMM流量混战的大背景下,网络调度发挥着关键作用。郑晓龙强调,“网络+”并非简单的带宽升级,而是要让网络成为AI集群的“第七代算力”。华为的网络调度技术如同“四两拨千斤”,能够有效提升推理性能。最后,郑晓龙呼吁业界各方携手共建标准,与合作伙伴及行业组织共同定义大模型时代下一代智算网络接口,推动整个行业的协同发展。

更多热门内容
谷歌TPU芯片获AI公司青睐:Anthropic将用百万芯片训练Claude大模型
全齐顗网科技讯 北京时间10月24日,据路透社报道,AI创业公司Anthropic周四表示,其Claude大模型将使用多达100万个谷歌AI芯片进行训练,这些芯片价值数百亿美元。Anthropic希望借此…

2025-10-26

​西北工大“水下幽灵”:120mm仿生水母机器人,AI赋能深海隐秘监测​
该机器人不仅在形态与运动上高度仿生自然水母,更将人工智能(AI)深度集成于仿生平台,实现了水下环境中的“具身智能”,为突破深海探测关键瓶颈提供了前沿解决方案。 陶凯教授现场演示了该机器人的智能化应用,通过集成…

2025-10-26

生成式AI赋能搜推广:快手如何以创新技术重塑行业新生态?
智东西10月26日报道,生成式AI技术正在加速渗透至搜索、推荐和广告领域,昨日,快手在一场技术沙龙活动中全方位解读了生成式技术在快手推荐系统、电商搜索、广告出价场景中的实践与应用。推荐系统方面,快手的One…

2025-10-26