ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

DeepSeek携手北大发布新论文,“条件记忆”亮相并开源记忆模块Engram

时间:2026-01-14 07:26:07来源:快讯编辑:快讯

在大型语言模型领域,一项创新研究引发了广泛关注。北京大学与DeepSeek团队携手合作,共同完成了一项具有突破性的研究,其成果以论文形式呈现。论文题为《基于可扩展查找的条件记忆:大型语言模型稀疏性的新维度》(Conditional Memory via Scalable Lookup: A New Axis of Sparsity for Large Language Models),并于近日对外发布。

该研究的核心亮点在于提出了“条件记忆”(conditional memory)这一全新概念。与传统大型语言模型架构不同,研究团队引入了可扩展的查找记忆结构。这一创新设计在保持模型参数和算力不变的情况下,为模型性能带来了显著提升。具体而言,模型在知识调用、推理、代码编写以及数学运算等多项任务中的表现均得到了大幅优化。

值得一提的是,DeepSeek创始人梁文锋也出现在了论文的合著作者名单之中,这无疑为这项研究增添了更多关注度。与此同时,DeepSeek团队还同步开源了与该研究相关的记忆模块Engram,为行业内其他研究人员提供了进一步探索和应用的宝贵资源。

更多热门内容
嫦娥六号月壤新发现:大型撞击致月球背面深部物质丢失
来自中国科学院地质与地球物理研究所等单位的科研人员,通过分析嫦娥六号在月球背面南极-艾特肯盆地采集的玄武岩样品,首次揭示约42.5亿年前,南极-艾特肯盆地撞击事件不仅砸出了月球上最大的坑,还“烤焦”了月球背面…

2026-01-14

欧洲天文学家新发现:白矮星周围现彩色冲击波成因成谜
他们利用欧洲南方天文台位于智利的甚大望远镜观测发现,这颗白矮星在宇宙中移动时,其周围形成彩色弓形激波。吸积盘为白矮星提供能量的同时,其中物质外溢产生强大外向流,继而与周围气体撞击形成冲击波。最新研究发现的白矮…

2026-01-14

2026年1月13日长征六号改火箭成功送遥感五十号01星进入预定轨道
本文转自【央视新闻客户端】; 北京时间2026年1月13日22时16分,我国在太原卫星发射中心使用长征六号改运载火箭,成功将遥感五十号01星发射升空,卫星顺利进入预定轨道,发射任务取得圆满成功。该卫星主要用…

2026-01-14

中山大学携手中科宇航 成功完成百公里级在线轨迹优化制导飞行试验
自火箭返回至距地面 70km 开始,由中山大学自主研制的“慎思”二号 D(SS-2D)箭载制导计算机执行在线轨迹优化返回制导程序,在复杂偏差和干扰条件下,实现了火箭助推器高精度定点、定姿落地,飞行试验获得圆满…

2026-01-14

嫦娥六号玄武岩样品:解锁42.5亿年前月球撞击影响之谜
通过对嫦娥六号在月球背面采集的玄武岩样品进行分析,他们首次发现约 42.5 亿年前的月球南极 -艾特肯盆地撞击事件导致某些易挥发元素的丢失。通过高精度同位素分析,科研人员发现 42.5 亿年前小行星撞击月球…

2026-01-14

2026年航天首战告捷!长征六号改火箭成功送遥感五十号01星入轨
1月13日22时16分,我国在太原卫星发射中心使用长征六号改运载火箭,成功将遥感五十号01星发射升空,卫星顺利进入预定轨道,发射任务取得圆满成功。 1月13日22时16分,我国在太原卫星发射中心使用长征六号改…

2026-01-14