ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

塞萨洛尼基大学MBC技术突破:为AI装上“无限压缩存储器”

时间:2026-01-28 23:53:03来源:互联网编辑:快讯

希腊塞萨洛尼基大学研究团队在第41届ACM应用计算会议上提出一项突破性技术——MBC(Memory Bank Compression),为解决大语言模型知识更新难题提供了创新方案。这项技术通过构建可压缩的外部记忆库,使AI系统在持续学习新信息的同时保持对旧知识的记忆,且存储需求仅为传统方法的百分之一。

当前大语言模型面临核心矛盾:训练完成后知识体系固化,更新需重新训练整个模型或依赖外部检索系统。前者导致"灾难性遗忘"现象,后者增加响应延迟且检索质量不稳定。研究团队开发的MBC系统通过构建外部记忆库突破这一瓶颈,该记忆库采用独特的压缩编码机制,将文档转化为紧凑索引存储。

技术核心在于512个"标准模板"构成的密码本系统。新文档到达时,系统自动匹配最相似模板并存储索引编号,实现信息的高度浓缩。实验数据显示,这种压缩方式使记忆库存储需求降至原始规模的0.3%,70亿参数模型处理相同信息量所需的存储空间从1000GB压缩至3GB。在线重置机制持续优化模板利用率,防止出现"冷门模板"闲置现象。

为提升压缩信息的利用效率,研究团队在注意力机制中引入键值低秩适应(KV-LoRA)技术。该技术通过添加少量可训练参数(仅占原始模型的0.45%),使模型能够精准解读压缩记忆。综合损失函数设计平衡了问答准确性与压缩质量,确保系统在端到端训练中协调运作。这种设计使模型在保持核心参数不变的情况下,显著提升对历史信息的调用能力。

在线学习功能是MBC的显著优势。新文档处理仅需前向计算完成向量编码与索引匹配,无需梯度更新,实现实时知识更新。回答问题时,聚合网络将检索到的多个记忆片段整合为调制信号,注入注意力机制生成包含历史信息的回答。这种设计使系统在持续运行中知识储备不断扩充,同时内存需求增长速度远低于传统方法。

在StreamingQA、SQuAD和ArchivalQA三个权威数据集的测试中,MBC展现显著优势。以GPT2-Large模型为例,在StreamingQA数据集上精确匹配率提升21.4%,F1分数提高11.6%,记忆库压缩比达98.7%;在SQuAD数据集上,GPT2-XL模型的F1分数提升18.2%,存储需求压缩99.6%;ArchivalQA数据集测试显示,LLaMA-2-7B模型的精确匹配率提升16%,F1分数提高19.9%。

抗遗忘能力测试验证了MBC的持续学习优势。系统在处理1600个文档后,对初始200个文档的F1分数保持率仍达95%以上。密码本重置机制在此过程中发挥关键作用,通过动态维护模板多样性防止信息偏向。实验数据显示,启用重置机制的模型密码本使用复杂度维持在高位,而未启用机制的模型复杂度在训练过程中下降超过80%。

该技术具有显著商业价值。存储成本降低两个数量级意味着企业可用相同预算部署规模扩大百倍的AI系统。在线学习能力特别适用于新闻、金融、医疗等对信息时效性要求高的领域,使AI系统无需停机即可实现知识更新。研究团队开发的GitHub开源代码为技术落地提供便利,密码本规模可根据应用需求灵活调整。

尽管取得突破,研究团队指出技术仍存在改进空间。当前验证主要集中于问答任务,其他应用场景的表现有待探索;密码本规模的自动优化机制尚未完善;压缩过程的信息损失在特定场景可能产生影响。未来研究方向包括分层压缩策略、自适应压缩强度和强化学习记忆管理,这些探索可能为大语言模型的持续进化开辟新路径。

Q&A环节解答了关键技术疑问:MBC通过索引编码实现记忆压缩,在三个测试数据集上均提升回答准确性;特别适用于需要持续更新的AI应用场景,企业存储成本可降低99%以上;技术核心优势在于平衡存储效率与信息完整性,其跨领域技术融合思路为AI发展提供新范式。完整技术细节可通过会议论文编号979-8-4007-2294-3查阅。

更多热门内容
羿弓氢能SOEC氢气压缩机交付,为氢能产业升级注入高效智能新动力
作为全国首个同时具备商业化运营与氨裂解制氢双重属性的示范项目,其通过“固体氧化物电解水制氢”的创新技术路径,从根本上规避了传统氢气储运面临的高成本与安全隐患,终端氢价较常规路径降低约20%,为氢能商业化应用提…

2026-02-08

长沙本土AI企业星兴万物战略升级 锚定AI漫短剧赛道获2000万融资助力
在“中国V谷”马栏山视频文创园,集聚6.4万名文创科技人才及顶尖文娱从业者,为AI漫短剧项目落地提供了得天独厚的人才支撑,也让企业得以避开大厂在通用领域的激烈竞争,精准切入“AI+内容”新蓝海。据介绍,该笔融…

2026-02-08

我国科研团队攻克银纳米团簇难题 达成高产率克级合成与原子级精准操控
月 6 日消息,中国科学院合肥物质院固体所伍志鲲研究员、庄胜利研究员团队联合安徽师范大学陆洲教授团队,引入即时“反伽伐尼还原”合金化策略,解决大尺寸银纳米团簇稳定性差、多分散、产率低的难题,实现了大尺寸银纳米…

2026-02-08

可重复使用火箭:中国航天突破“回来”难题 开启深空新篇章
国际经验早已给出答案:成熟复用后,单次发射成本可下降50%以上,周转周期从“按年算”压缩到“按天算”。 中国这次试验,踩的是新赛道的起跑线。 结论只有一句:把一次性,变成可循环,中国航天正在从“能飞”切换到…

2026-02-08

中国航天新突破!可重复使用航天器发射,开启低成本太空探索新篇
据人民日报和新华社消息,2月7日上午,酒泉卫星发射中心传来振奋人心的消息——我国使用长征二号F运载火箭成功发射一型可重复使用试验航天器,这是该型航天器的第四次飞行任务,标志着中国在低成本太空探索领域又迈出坚实…

2026-02-08

火星生命探索迎新进展:16个大型古河流域成寻找生命“希望之地”
一项新研究首次确定了火星上规模最大的16个古河流域,被视为最有希望寻找生命的区域。 美国得克萨斯大学奥斯汀校区的研究人员通过收集并分析之前发表的关于火星山谷、湖泊和河流特征的数据发现,火星上有19个主要的山…

2026-02-08

木星“身材”更新:赤道半径缩4公里,极直径减24公里更显扁了
其实在此之前,天文学家也是利用这种方式来计算木星尺寸的。现有的数据,是上世纪70年代的时候,美国宇航局的先驱者号和旅行者号探测器,利用6次无线电掩星方法测量的。和地球相比,木星不仅自转速度更快,而且作为气体…

2026-02-08

国产首台盾构饱和带压进仓设备“深海空间站”首秀成功 助力深埋隧道建设
2月6日,在甬舟铁路金塘海底隧道宁波侧施工现场,国产首台盾构饱和带压进仓设备“深海空间站”完成“首秀”,成功实施75米深高压环境盾构进仓作业,标志着我国自主研发盾构饱和带压进仓技术成功应用,为未来深埋跨海隧…

2026-02-08

AI“雇人”干活新平台RentAHuman.ai上线,为人类创造新就业契机
随着用户数量激增,平台上逐渐出现更多现实任务,包括代取旧金山邮局挂号信件、向 Anthropic 总部送花致谢,以及来自 AI 助手 DanXiaojuan 的请求 —— 寻找并拍摄一根“最漂亮、最酥脆的…

2026-02-08