ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

华为携手湖北移动完成全国运营商首个AI推理加速现网测试 成效显著

时间:2026-06-27 01:38:10来源:快讯编辑:快讯

华为与中国移动通信集团湖北有限公司(湖北移动)在2026 MWC上海展期间联合宣布,双方成功完成全国运营商首个AI推理加速解决方案的现网测试。这一突破性成果标志着运营商在智算业务领域的技术部署迈出关键一步,为长序列AI推理场景提供了高效解决方案。

测试基于华为OceanStor A800存储系统与昇腾A3超节点架构,通过集成UCM(Unified Cache Manager,推理记忆数据管理)技术,在长序列AI推理场景中实现了Token吞吐率最高提升372%的显著效果。该方案有效突破了传统架构在处理长上下文时的性能瓶颈,为运营商智算资源的高效利用提供了技术支撑。

在湖北移动现网环境中,测试团队部署了vLLM-Ascend框架,针对MiniMax M2.5、GLM-5.1等主流大模型,模拟了8K至190K长序列输入场景。结果显示,在MiniMax M2.5模型下,启用UCM后首Token延迟(TTFT)优化幅度达26%至62%,单NPU卡Token输出效率(TPS)显著提升。其中,64K序列长度下TPS提升58%,128K序列长度下提升78%。

GLM-5.1模型的测试数据更为突出:UCM使TTFT优化幅度达到51%至93%,TPS提升范围为56%至372%。具体来看,64K序列长度下TPS提升313%,128K序列长度下最高提升372%。这一成果表明,随着上下文长度的增加,AI推理加速方案的优势进一步放大,有效解决了长序列推理中的KV Cache容量限制问题。

对于运营商而言,该方案的应用将显著提升现网智算资源的利用效率。在大模型推理、智能客服、内容生成、行业智能体等长序列AI业务场景中,运营商可降低长上下文推理带来的性能压力,同时优化用户体验。华为表示,此次测试验证了AI推理加速方案在复杂场景下的可靠性,为运营商智算业务的大规模部署奠定了基础。

更多热门内容
华为携手湖北移动完成全国运营商首个AI推理加速测试:性能显著提升
此次测试基于华为OceanStor A800存储与昇腾A3超节点架构,并搭载UCM(Unified Cache Manager,推理记忆数据管理)能力,在长序列AI推理场景下,实现Token吞吐率最高提升3…

2026-06-27

云网智算协同发力 中国电信以全链创新驱动数字经济新跨越
面向6G技术研发,中国电信系统推进“全域智惠网络(UIN)”技术体系研究,围绕全空间覆盖、全接入协同、全场景赋能开展技术预研。对于中国电信而言,布局这些赛道并非跨界拓展,而是“云改数转智惠”战略下核心能力的…

2026-06-27

2026MWC上海:中国电信破局算力孤岛,6G与量子计算引领数智新未来
从贯通“东数西算”的息壤算力网络,到系统前瞻布局的6G全域智惠网络(UIN),再到全球领创的“天衍”量子优越性云服务,中国电信在2026世界移动通信大会(MWC上海)现场展示了一系列颠覆性的战略演进,构建起一…

2026-06-27

中国电信柯瑞文:AI时代云网宽带变革,从流量到Token开启价值新篇
柯瑞文最后表示,作为WBBA核心发起单位,中国电信将一如既往全力支持、深度参与协会各项工作,与全球业界同仁一道,坚守初心,深化技术交流和产业协同,携手各方缩小数字鸿沟和智能鸿沟,共同培育区域发展新动能,为…

2026-06-27

量子科技与AI深度融合 驱动通信产业迈向智能安全新未来
他指出,一方面,借助量子精密测量技术,可精准排查芯片光路、电路缺陷,提升产品良品率与综合性能;另一方面,基于量子原理打造的光量子芯片,在特定任务中具有高速运算、低功耗、大带宽等潜在优势,是未来量子通信、量子…

2026-06-27

2026折叠屏手机怎么选?万元预算AI强机盘点,OPPO Find N6领跑全场
价格:16GB+1TB版本售价11999元,与Find N6持平,是一款在续航和互联上表现突出的水桶型折叠旗舰。总结与购买建议 综合来看,在万元预算区间寻找AI能力强大的折叠屏手机,我们需要从AI功能的深度…

2026-06-27