ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

华为联合湖北移动AI推理加速现网测试,Token吞吐率大增372%

时间:2026-06-26 10:26:30来源:快科技编辑:快讯

6月26日消息,据“华为数据存储”公众号消息,在2026 MWC上海展期间,华为与中国移动通信集团湖北有限公司(以下简称“湖北移动”)联合宣布,双方已成功完成全国运营商首个AI推理加速解决方案现网测试。

此次测试基于华为OceanStor A800存储与昇腾A3超节点架构,并搭载UCM(Unified Cache Manager,推理记忆数据管理)能力,在长序列AI推理场景下,实现Token吞吐率最高提升372%的突破性成果,为运营商智算业务的高效部署提供了重要技术支撑。

据介绍,本次测试在湖北移动现网环境中部署vLLM-Ascend框架,面向MiniMax M2.5、GLM-5.1等主流大模型,模拟了8K至190K长序列输入场景。

测试结果显示,在MiniMax M2.5模型场景下,启用UCM后,首Token延迟(TTFT)优化26%至62%,单NPU卡Token输出效率(TPS)也获得明显提升。

其中,在64K序列长度下,TPS提升58%;在128K序列长度下,TPS提升78%。

在GLM-5.1模型场景下,UCM带来的加速效果更加明显,TTFT优化幅度达到51%至93%,TPS提升56%至372%。

具体来看,在64K序列长度下,TPS提升313%;在128K序列环境下,TPS最高提升372%。

华为表示,测试结果表明,随着上下文长度不断增加,AI推理加速方案的优势将持续放大,有效解决了长序列推理中的KV Cache容量瓶颈。

对于运营商而言,这意味着在大模型推理、智能客服、内容生成、行业智能体等长序列AI业务场景中,现网智算资源有望获得更高利用效率,同时降低长上下文推理带来的性能压力。

更多热门内容
OpenAI报告:2025年8月以来非开发者用户Codex用量激增,内部使用率近98%
IT之家 6 月 26 日消息,OpenAI 昨日(6 月 25 日)发布报告,称自 2025 年 8 月以来,非开发者对 Codex的使用量中,个人用户增长了 137 倍,组织用户增长了 189 倍,Op…

2026-06-26

具身智能机器人多楼层配送实测:导航、操作、交互谁能真正突破瓶颈?
但在多楼层自主配送场景中面临两个关键短板:一是无标配机械臂,第三方集成的操作能力在精度和可靠性上难以达到商用级标准;二是电梯对接方案依赖外挂模块,在多样化电梯协议适配方面的成熟度与普渡机器人存在差距。但在多楼…

2026-06-26

广东检测机器人企业崛起:藦卡领衔,技术革新引领智能制造新未来
广东省在检测机器人领域具有巨大的发展潜力,众多企业在技术研发和市场应用中取得了显著成绩。藦卡机器人等企业在高精度、多场景工业机器人研发方面的优势,为广东乃至全国的智能制造和自动化发展提供了强有力的支持。 总…

2026-06-26

中国首台重载智能盾构换刀机器人亮相厦门 开启大盾构施工无人换刀新纪元
6月25日,在位于福建厦门的厦金大桥(厦门段)项目环岛路隧道施工现场,中国首台重载智能盾构换刀机器人在“厦金号”盾构机完成上机调试。 6月25日,在位于福建厦门的厦金大桥(厦门段)项目环岛路隧道施工现场,中…

2026-06-26

别盲目追捧保姆机器人!“银发族”选智能硬件,“小而精”更实用
“对消费者,特别是年长的消费者来说,不必追求一个‘大而全’的‘保姆机器人’,而应从实际需求出发选择合适的智能硬件,因为市场上已经有很多能解决具体问题的产品。” 马智雯举例,扫地机器人就属于这类智能硬件,而且…

2026-06-26

模块化桁架机器人:打破传统局限,解锁柔性制造新未来
模块化桁架机器人的核心思想,是将整个系统解耦为标准化的功能单元,并通过统一的接口协议实现快速拼装与重构。 在这一技术转型浪潮中,云雀机器人凭借其深厚的机械设计与精密制造能力,成为国内模块化桁架领域的重要推动…

2026-06-26

我国首台100%国产化智能盾构换刀机器人发布 开启大盾构施工无人换刀新篇章
中国工程院院士钱七虎表示,智能换刀机器人的研发,在安全、效率、成本等方面取得成效,为我国交通工程装备自主化、无人化、智能化发展探索了新路径,也为产业化应用奠定了基础。 目前,智能盾构换刀机器人已在16米…

2026-06-26

达沃斯论坛国产人形机器人秀绝技 咖啡制作递送自主完成显实力
这台名为MATRIX-3的人形机器人由国内具身智能企业矩阵超智自主研发,也是本届达沃斯论坛全场唯一投入实景服务的人形机器人。有嘉宾在接过机器人递来的咖啡后表示,这是第一次近距离观察人形机器人在真实环境中完成…

2026-06-26

作为科技全球首发人形护理机器人,具身智能破解养老护理“不可能三角”
圆桌论坛环节,以《具身智能落地:从技术突破到养老护理新范式》为主题,河北工业大学二级教授、具身智能联合实验室主任郭士杰,桂林医科大学科研院常务副院长、呼吸疾病实验室主任马礼兵,柳州城市职业学院副校长、康养学…

2026-06-26

华为携手湖北移动完成全国运营商首例AI推理加速测试:性能显著提升
此次测试基于华为OceanStor A800存储与昇腾A3超节点架构,并搭载UCM(Unified Cache Manager,推理记忆数据管理)能力,在长序列AI推理场景下,实现Token吞吐率最高提升3…

2026-06-26