MLA(Multi-head Latent
Attention多头潜在注意力架构)凭借低秩压缩KV缓存设计,实现长上下文推理的显存与带宽双重优化,其有效性已在 DeepSeek-V2
等模型中得到了验证。但主流预训练模型如LLaMA、Qwen千问等多基于GQA构建,企业已投入大量工程优化,复用MLA需重训,成本极高。为此,在北京大学
鲲鹏昇腾科教创新卓越中心的算力支持下,北京大学人工智能研究院助理教授张牧涵团队提出TransMLA转化框架,实现了无需重训便可将主流模型向MLA迁移。

TransMLA针对GQA向MLA迁移的核心痛点,实现四大技术模块的精准破局:一是GQA→MLA结构映射,破解分组KV头与MLA单头潜在表示不兼容问题,通过特定的线性变换,将GQA分组后的K、V向量投影/融合为单一的低秩潜在表示,并配备上投影矩阵保障KV信息精准恢复,筑牢迁移基础;二是提出RoRoPE技术方案,通过创新适配让位置编码顺畅融入低秩压缩流程,解决了直接对RoPE应用PCA等通用降维方法可能导致的位置信息损失或模型性能下降问题;三是通过将RoPE中相邻频率的旋转维度进行折叠(Folding)与融合,在降低参数量的同时,更高效地集中和保留关键的位置信息,从而维持模型在长序列下的语义理解能力;四是通过均衡Key和Value矩阵在压缩前的范数分布,提升联合压缩(如PCA)的数值稳定性,减少信息损失。
在技术落地过程中,昇腾发挥了关键支撑作用。其高效并行计算架构满足结构映射模块的多任务协同处理需求,保障了架构迁移效率;其优化的存储与缓存体系,为
FreqFold 的频率信息处理、BKV-PCA 的范数均衡提供稳定硬件基础,有效提升 KV 压缩的稳定性与资源利用效率,助力 TransMLA
核心技术平稳落地。
经过实验显示TransMLA的转换过程性能优势明显,裁剪LLaMA-2-7B模型68.75%的KV缓存后无需训练,核心性能仅轻微损失,在32K序列长度、FP16精度下,基于昇腾平台的推理速度较之于业界主流GPU平台有显著提升。依托开放的生态资源,昇腾已推动TransMLA稳定支持主流模型部署并将集成至vLLM/SGLang等高性能推理框架生态,便于用户部署,大幅降低企业落地适配成本。
TransMLA与昇腾的协同创新,打通了主流模型与MLA架构鸿沟,充分发挥昇腾生态优势。昇腾全链路支持实现TransMLA“零重训、低损失”目标,保留模型参数优势,降低企业基于昇腾的升级门槛。这一软硬件协同典范,为长上下文推理提供昇腾生态解决方案,推动自主计算与前沿AI融合,彰显昇腾核心引领作用,为大模型产业依托自主硬件降本增效提供可行路径。
顺丰亮相第九届全球深商大会,共探品牌出海与智能化转型新路径
2026年1月6日,第九届全球深商大会暨中国企业家俱乐部20周年大会在深圳召开。大会以“遇见未来的中国企业思想”为主题,汇聚80余位中外商界领袖与专家学者,并透过主论坛、产业主题会、中欧经济合作论坛等系列活动,围绕品牌出海、人工智能等议题展开了深度对话。顺丰集
2026-01-13
不会建模也能玩?小白也能玩转的创想三维3D打印机
如果你对 AI 的印象还停留在手机屏幕里的对话框,或者只是让它画画图、写写诗,那么在 2026 中国智能硬件开年第一展上,创想三维展台的一台3D打印机可能会刷新你的认知。在 5000+ 平米的展区中,创想三维的新品 SPARKX i7 成了“流量担当”。很多观众围着这台正在“凭空
2026-01-13
双百!100%中国车企全球业务接入阿里云
摘要:AI和汽车行业正在加速融合,未来阿里云全栈AI将支撑全球车企建立领先的技术架构与智能体验。近日,在2026年新加坡国际车展上,阿里云表示已在汽车行业实现“双百”突破:中国车企不仅在国内市场全部选择了阿里云,在出海业务中,也100%使用了阿里云。当前,出海不
2026-01-13
无锡智能穿戴品牌逸博士血压手表亮相CES 2026
全球顶级消费电子盛会CES 2026近日盛大启幕,本届展会以人工智能为核心焦点,加速推动行业从技术驱动向用户体验为中心的创新转型。期间,逸博士渠道合作伙伴携旗舰版智能血压手表重磅亮相,凭借精准的血压测量技术、领先的AI算法,引发行业广泛关注,为智能穿戴领域的健
2026-01-13
BeauEver以双核技术开启抗衰新路径:铂金肌源焕活系列正式推出
2025年12月,新西兰高端院线细胞抗衰品牌BeauEver正式推出了其年度核心新品——铂金肌源焕活系列水乳霜。这一系列的发布,标志着品牌将其提出的“全息化抗衰体系”首次完整落地为具体产品线。该系列通过独家研发的CelKinetic™细胞能量包与ECMhydro™细胞生态包构成的双
2026-01-13
节点传播的AI解法:海唐用三个数字营销案例看透AI新逻辑
当营销节点的内容密度与创意精度成为竞争关键,海唐新媒以 AI 为核心引擎,在多个标杆项目中,趟出了节点传播的新路径——从内容生产效率的跃迁,到品牌与节点的深度绑定,再到用户参与度的全域引爆,三个案例勾勒出 AI 赋能营销的新逻辑。在某新能源新势力车企大型活动
2026-01-13
微粒贷逾期怎么办?关于微粒贷逾期你必须要了解的几件事
在互联网金融快速普及的今天,小额信贷以其便捷性融入日常生活。微众银行的小额信贷产品微粒贷作为其中代表性产品,成为很多人资金周转的选择之一。然而,在使用微粒贷的过程中如果未能妥善做好资金规划,导致微粒贷逾期,也会带来困扰。今天小编就为大家详细科普一下微
2026-01-13