ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

DeepSeek-V3.2-Exp模型发布:引入稀疏注意力,API降价超五成并开源

时间:2025-09-29 22:47:11来源:快讯编辑:快讯

DeepSeek今日宣布推出实验性版本DeepSeek-V3.2-Exp模型,该版本作为新一代架构研发的过渡性成果,在长文本处理领域实现了关键技术突破。此次更新不仅引入了自主研发的DeepSeek Sparse Attention(DSA)稀疏注意力机制,更通过严格的对比测试验证了其技术有效性。

研发团队在V3.1-Terminus版本基础上,通过引入DSA机制实现了细粒度注意力控制。这项创新技术能够在保持模型输出质量的前提下,显著提升长文本场景下的训练与推理效率。据技术文档披露,DSA机制通过动态调整注意力权重分配,使计算资源更集中于关键信息区域,从而减少无效计算。

为确保技术评估的严谨性,开发团队将V3.2-Exp的训练参数配置与前代版本完全对齐。在涵盖自然语言处理、逻辑推理等领域的20余个公开评测集中,新版本各项指标均与V3.1-Terminus持平,部分长文本任务处理速度提升达40%。这种在效率与效果间的平衡,验证了稀疏注意力机制的实际应用价值。

伴随模型升级,DeepSeek同步推出API服务降价方案,开发者调用成本降幅超过50%。这一调整旨在降低技术创新的应用门槛,促进稀疏注意力技术的生态发展。目前用户可通过官方App、网页端及小程序体验新版本,各平台已完成同步更新。

考虑到实验性版本的技术特性,研发团队为V3.1-Terminus保留了专用API接口,方便用户进行AB测试对比。这种双版本并行的策略,既保障了现有服务的稳定性,也为新技术验证提供了真实场景支持。据开源社区消息,V3.2-Exp模型代码已在Huggingface与魔搭平台开放下载。

更多热门内容
小米17系列首销火爆,两年后大折叠新机“小米17 Fold”将携强配置登场
据小米手机官方微博消息,系列机型(全系)开售5分钟,刷新2025 年国产手机全价位段新机系列“首销全天销量、销额纪录”。 今日消息,相关媒体爆料称,小米公司正开发一款代号为“pecan”的新款折叠屏手机,预…

2025-09-29

苹果2025上半年新品来袭:iPhone 17e登场,多款iPad同步更新
尽管引入了灵动岛功能区域,iPhone 17e的屏幕规格保持不变,仍为6.1英寸OLED面板,支持60Hz刷新率,屏幕素质与同期iPhone16标准版一致。 值得一提的是,iPhone 17e将原生搭载最…

2025-09-29

AMD与NVIDIA高端AI芯片激战正酣:MI450与Rubin性能参数竞相攀升
随着下一代产品的推出,AMD和NVIDIA之间的技术差距有望缩小,双方都计划采用相同的技术,例如HBM4、台积电的N3P工艺节点以及芯粒(chiplet)设计。 AMD对MI450系列寄予厚望,其高管For…

2025-09-29

马斯克透露特斯拉加速“擎天柱”人形机器人量产,称其将成公司未来价值核心
外媒称,特斯拉 Optimus 是该公司的人形机器人项目,该项目于几年前首次公布,在过去一年中,其重要性日益凸显,并成为人们关注的焦点。 马斯克表示,特斯拉正在努力扩大Optimus的规模,这是一个至关重要…

2025-09-29

OPPOvivo布局手持智能影像赛道,或借影像市场开拓业务新增长点
作为参考,目前手持智能影像设备主要细分为运动相机和全景相机,其中运动相机由 GoPro 和大疆主导,而全景相机市场则主要被影石Insta360 占领,两家公司在相关领域的成长历程如下: 某 OPPO 前员…

2025-09-29

卢伟冰点赞小米17系列首销,Pro Max销量领先,Pro版增单1TB版将交付
卢伟冰特别指出, Pro 版本已“轻松跨过 6K+ 门槛”,由于 Pro 系列市场需求旺盛,小米公司已决定增加 Pro版本的订单。小米团队迅速响应,决策增加 1TB 版本的生产,并计划于 10 月 5 日开…

2025-09-29

小米17系列相机再升级,“超级月亮”模式自动触发更便捷
【环球网科技综合报道】9月29日消息,小米相机部产品经理 @Bao_小李 发文回应了“是不是小米 17 Pro 和小米 17 的超级月亮模式删除了”这一问题。他表示,“答案是没有删除哈,并且月亮模式还变聪明了…

2025-09-29

王化卢伟冰双双发声:小米17系列无削减订单计划且首销成绩亮眼,销量有望超上代
PChome此前曾报道,天风国际证券分析师郭明錤调查后发现,小米17系列的出货量将大幅下降约20%(原定目标约为1000万台)。如果未来定价或市场营销没有进一步提升,17系列的总出货量可能会低于15系列的约8…

2025-09-29

DeepSeek-V3.2-Exp模型发布:稀疏架构助力长文本推理效率提升
【太平洋科技】9 月 29 日消息,深度求索公司正式发布 DeepSeek-V3.2-Exp 模型。据官方消息,这是一个实验性(Experimental)版本,旨在通过技术创新提升模型在处理长文本时的效率…

2025-09-29

余承东再担重任!任华为产品投资评审委员会主任 聚焦AI关键战役
IT之家 9 月 29 日消息,据新浪科技援引知情人士消息,华为公司今日任命余承东为公司产品投资评审委员会(IRB)主任,任命文件由任正非签发。 据悉,投资评审委员会的核心职能是对公司重大战略方向的资源投入、…

2025-09-29