ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

华为推出AI推理新技术UCM,计划2025年9月于魔擎社区首开源

时间:2025-08-13 03:32:01来源:IT之家编辑:快讯团队

华为近期宣布了一项重大技术创新,正式推出了名为UCM(推理记忆数据管理器)的AI推理加速解决方案。这一创新技术专为提升AI推理性能而设计,旨在通过优化缓存管理,实现更高效、低成本的推理运算。

UCM的核心在于其以KV Cache为基础的推理加速架构。该技术融合了多种先进的缓存加速算法,能够智能地分级管理推理过程中累积的KV Cache数据。这种管理方式不仅扩大了推理的上下文窗口,还显著提高了推理的吞吐量和降低了时延,有效减少了每Token的推理成本。据华为透露,UCM已经在多个实际业务场景中得到了验证,特别是在中国银联的“客户之声”、“营销策划”以及“办公助手”三大业务领域中,展现出了卓越的AI推理加速效果。

华为方面表示,他们计划在2025年9月将UCM技术正式开源,首发平台将是魔擎社区。未来,该技术将逐步向业界主流的推理引擎社区开放,并与所有Share Everything(共享架构)存储厂商及生态合作伙伴共享。这一举措无疑将为AI推理技术的发展注入新的活力,推动整个行业的创新与进步。

更多热门内容