ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

DeepSeek再发新论文聚焦条件记忆模块,或为V4技术架构铺路

时间:2026-01-13 16:34:32来源:互联网编辑:快讯

科技领域再掀波澜,人工智能公司DeepSeek近日在学术研究方面动作频频,继此前发布新论文后,又于1月12日晚推出聚焦大模型条件记忆模块的论文,这一成果引发业内广泛关注与诸多猜测。

此次论文是DeepSeek与北京大学携手完成,名为《基于条件查找的条件记忆:大型语言模型稀疏性的新维度》,DeepSeek创始人梁文锋也在作者之列。论文核心观点指出,大模型承担着两类性质迥异的任务,一类是组合推理,这需要深度动态计算;另一类是检索静态知识。然而,现有的Transformer架构没有原生知识查找机制,在查找不变知识时,只能通过低效计算模拟检索过程,白白浪费算力,既耗费时间又占用大量资源。

为攻克这一难题,DeepSeek团队引入条件记忆作为补充的稀疏性维度,并借助Engram条件记忆模块加以实现,巧妙优化了神经计算(MoE)与静态记忆(Engram)之间的权衡关系。研究过程中,团队还发现了U型缩放定律,该定律表明MoE专家和Engram记忆之间的混合稀疏容量分配,明显优于纯MoE基准模型。令人意外的是,虽然记忆模块看似主要助力知识检索,但团队在通用推理、代码和数学领域却观察到更为显著的收益提升。

简单来讲,当前MoE模型在处理推理和记忆固定知识时采用同一套方法,效率低下且算力浪费严重。而这篇论文本质上是对大模型进行“分工优化”,让专门模块负责专门事务,比如设置“记忆本”管理固定知识,推理模块专注复杂思考,并按照最佳比例分配资源,最终使模型运行速度更快、性能更聪明。

DeepSeek在论文结尾明确表示,条件记忆将成为下一代稀疏模型不可或缺的建模原语。基于此,有行业人士大胆猜测,此次提出的条件记忆或许就是下一代大模型DeepSeek V4的技术架构。

此前有消息称,DeepSeek计划于2月发布新一代旗舰模型DeepSeek V4,内部初步测试显示,V4在编程能力上超越了市场上其他顶级模型。不过,对于这一消息,DeepSeek尚未作出任何回应,同时报道也提到发布计划可能会根据实际情况有所调整。

自2024年底发布V3模型后,DeepSeek的下一代旗舰模型一直未露面。去年底虽发布了小更新V3.2版本,且该版本在多个基准测试中超过了OpenAI的GPT - 5和Google的Gemini 3.0 Pro,但行业对DeepSeek旗舰模型的期待值依旧很高,V4的推出无疑将成为业界瞩目的焦点。

更多热门内容
2025全球智能手机格局生变:苹果登顶,小米稳国产第一,vivo与OPPO竞逐
OPPO也是是前五品牌中唯一同比下降的,需要注意的是这里的OPPO只算上了一加,没有算realme,原因大家都懂。2026年vivo的压力才会真正体现出来,毕竟realme在海外市场还是很大的,OPPO三个品…

2026-01-13

苹果牵手谷歌引AI新局:新版Siri借Gemini升级,国行版AI方案待揭晓
苹果与谷歌将达成合作,苹果会借助Gemini大模型为旗下产品构建人工智能体系,备受关注的新版Siri将基于该模型打造,预计随iOS26.4系统同步推送。 据权威消息披露,苹果将以每年10亿美元的代价,获得谷…

2026-01-13

OpenAI被曝研发AI耳机“Sweetpea” 拟配2nm芯片或9月发布
在硬件规格方面,爆料称 OpenAI 希望为这款耳机配备“2nm 制程、智能手机级别的芯片”,其中三星 Exynos被认为是最有可能的选择。爆料还指出,OpenAI 计划在 9 月发布这款产品,首年出货量…

2026-01-13

小米自研玄戒O2芯片或今年Q2 - Q3发布 雷军透露二代将用于汽车
近日,数码博主“定焦数码”发文称,小米自研玄戒O2芯片预计今年Q2-Q3发布,9月份的概率很大。 值得注意的是,此前小米创办人,董事长兼CEO雷军在接受采访时表示,玄戒芯片体验超出预期,将考虑把第二代玄戒芯片…

2026-01-13

2025全球PC市场增长强劲 联想领跑 存储芯片供应或成2026年挑战
从具体品牌厂商表现来看,在2025年四季度的PC市场,联想以1931.3万台的出货量(同比增长14.4%)、25.8%的市场份额位居全球第一。 Omdia于2025年11月对B2B渠道合作伙伴进行的一项调查…

2026-01-13

苹果谷歌携手合作:Gemini模型助力苹果AI,自研之路稳步前行
【太平洋科技】1 月 13 日消息,苹果公司官宣将与谷歌联手,利用谷歌的大模型技术为其人工智能功能提供支持。苹果计划支付约 10亿美元年费,利用 Gemini 在后台协助训练和增强自研基础模型,但所有用…

2026-01-13

荣耀牵手泡泡玛特打造潮玩手机,跨界联名探索中端市场新路径
此次合作以荣耀500系列为基础,深度绑定泡泡玛特核心IP Molly,旨在打造“行业首款潮玩手机”,标志着手机厂商的IP跨界合作从动漫、游戏领域进一步扩展至潮玩圈层。分析指出,主打年轻时尚与人像摄影的荣耀50…

2026-01-13

智能穿戴新标杆!歌尔ULTRA METRIC携手SGS发布舒适度评估白皮书
展会期间,歌尔股份旗下体验设计品牌ULTRA METRIC携手国际公认的测试、检验和认证机构SGS,联合其他领军企业,共同发布《智能穿戴产品佩戴舒适度评估白皮书》(以下简称“白皮书”),为行业树立科学化、可量…

2026-01-13

荣耀500系列牵手泡泡玛特,1月19日潮玩新机来袭开启时尚科技新体验
早前,博主@数码闲聊站 便透露了一条关于“潮玩手机”的爆料,称泡泡玛特计划推出一款以潮流文化为主题的智能手机,虽然当时未透露合作品牌,但随后的官方确认表明,这款产品将是荣耀500系列的延续。此次与泡泡玛特的…

2026-01-13

个性化手机壳UV打印:探寻行业优势与高性价比靠谱品牌之选
此外,打印的图案具有良好的附着性,不会出现脱落、起皮等问题,为手机壳提供了持久的美观和品质保障。在手机壳UV打印方面,公司凭借先进的设备和专业的技术团队,能够提供高质量、高精度的打印服务。 总之,个性化手机…

2026-01-13