ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

华为携手湖北移动完成全国运营商首例AI推理加速测试:性能显著提升

时间:2026-06-26 15:28:17来源:快讯编辑:快讯

在2026 MWC上海展期间,华为携手中国移动通信集团湖北有限公司(以下简称“湖北移动”)共同宣布,双方已顺利完成全国运营商首个AI推理加速解决方案的现网测试,标志着AI技术在运营商领域的应用迈出重要一步。

此次测试依托华为OceanStor A800存储系统与昇腾A3超节点架构,并引入UCM(Unified Cache Manager,推理记忆数据管理)技术,在长序列AI推理场景中实现了显著突破。测试数据显示,Token吞吐率最高提升达372%,为运营商智算业务的高效部署提供了强有力的技术支撑。

测试在湖北移动现网环境中展开,采用vLLM-Ascend框架,针对MiniMax M2.5、GLM-5.1等主流大模型,模拟了8K至190K的长序列输入场景。这一设计旨在全面评估AI推理加速方案在不同长度上下文下的性能表现。

在MiniMax M2.5模型测试中,启用UCM技术后,首Token延迟(TTFT)优化幅度达到26%至62%,单NPU卡Token输出效率(TPS)显著提升。具体而言,在64K序列长度下,TPS提升58%;在128K序列长度下,TPS提升78%,展现了该方案在长序列推理中的高效性。

而在GLM-5.1模型测试中,UCM的加速效果更为突出。TTFT优化幅度高达51%至93%,TPS提升范围则达到56%至372%。特别是在64K序列长度下,TPS提升313%;在128K序列环境下,TPS最高提升372%,进一步验证了AI推理加速方案在复杂场景下的卓越性能。

华为方面表示,测试结果表明,随着上下文长度的增加,AI推理加速方案的优势愈发明显。该方案有效解决了长序列推理中的KV Cache容量瓶颈问题,为运营商在大模型推理、智能客服、内容生成、行业智能体等长序列AI业务场景中提供了更高效的资源利用方案,同时降低了长上下文推理带来的性能压力。

更多热门内容
国家能源局:人工智能用电激增,统筹资源多维度推进算电协同发展
国家能源局局长王宏志26日在国新办举行的“开局起步‘十五五’”系列主题新闻发布会上表示,当前人工智能和能源已经驶入双向赋能的“快车道”。人工智能爆发式增长带动用电量激增。每让人工智能生成5秒的高清视频,它的用…

2026-06-26

MWC26上海启幕:算力基建新篇,能源装备协同共筑AI应用新基石
算力设施用电规模持续扩大,绿电接入正逐步进入项目布局、能源配置和运行管理等前置环节,成为影响项目长期运营的重要因素。正泰持续拓展“光伏+”应用场景,将光伏系统引入铁塔基站,目前已在湖南、浙江、广东等地落地应用…

2026-06-26

中国移动联合产业伙伴发布5G-A与具身智能案例集 赋能千行百业数智化转型
本次发布的四大核心应用场景各有侧重、协同互补,覆盖民生服务普惠升级、工业生产安全提质、公共应急能力筑牢、重大赛事标杆引领四大核心领域,兼顾商业落地价值、安全生产价值、社会公共价值与行业示范价值,形成可快速复…

2026-06-26

华为“天地一体”布局:构建AI原生底座,引领通信产业新十年变革
当运营商开始卖 Token,天地一体网络决定了其服务的物理疆域,这本质上是算力基础设施的‘出海’。 AI原生核心网打通了通信、算力、智能的边界,原本由软件厂商主导的行业数字化市场,变成通信设备商、运营商共同主…

2026-06-26

苹果调整芯片发布策略:M6专注入门款,M7系列高端芯片或2027年登场
【CNMO科技消息】6月26日,据外媒报道,苹果正在调整其AppleSilicon芯片的发布节奏,以加快专为人工智能工作负载设计的芯片的推出速度。 据CNMO科技了解,苹果计划最早于今年发布面向入门级Mac…

2026-06-26