ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

DeepSeek V3.2 双模型发布:线性复杂度长文本 + 无惩罚深度思考,开源阵营再冲第一梯队

时间:2025-12-03 09:50:49来源:CHINAZ编辑:快讯

DeepSeek 发布 V3.2(标准版)与 V3.2-Speciale(深度思考版),官方评测显示:

- V3.2在128k 上下文场景下与 GPT-5互有胜负

- V3.2-Speciale 在 MMLU、Humaneval 等基准中与 Gemini3Pro 打平,IMO2025盲测获金牌分数线83.3%

转正稀疏注意力(DSA)是核心升级:通过“目录”式路由token,将长文本计算复杂度从O(n²)降至O(n),显存占用下降40%,推理速度提升2.2倍,首次在开源模型实现百万token单卡推理。

后训练环节,团队把>10%整群算力投入强化学习,采用组对强化学习(GRPO)+多数投票,让模型在代码、数学与工具调用任务上逼近闭源对手。V3.2-Speciale取消“思考长度惩罚”,鼓励更长链式推理,平均输出token较Gemini3Pro高32%,但准确率提升4.8个百分点。

模型已上线GitHub与Hugging Face,权重采用Apache2.0协议,允许商业化。DeepSeek表示,下一步将开源长文本DSA内核与RL训练框架,继续把“闭源优势”转化为社区基础设施。行业评论称,若后续版本保持迭代节奏,开源阵营有望在2026年前实现“长文本+推理”双重领先。

更多热门内容
阳光新能源智能组件全球首发 引领光伏产业开启系统增值新时代
上海人工智能研究院、全球工业人工智能联盟卓越中心秘书长徐纯表示:“L1到L4的智能分级体系绘制了清晰的技术路线图,将引导产业链上下游协同发力,推动产品创新从企业单点突破升级为全行业共识共建,加速光伏产业的智能…

2026-06-03

太阳能热水器检测机构差异大,国联质检凭专业实力脱颖而出
二、检测项目的差异太阳能热水器涉及热性能、安全性能、可靠性、水质、外观与结构等多方面指标。一看资质合规性,选择具有CMA、CNAS等相关资质的机构,如国联质检;二看技术覆盖度,检测机构应能检测各项性能指标,…

2026-06-03

济南“鲲鹏智飞平台”上线:无人机享卫星导航 开启低空经济新篇章
在山东济南,通过这里搭建的全国最大规模城市低空智慧管理中枢——鲲鹏智飞平台,无人机也可以享受卫星导航了。 出于全域飞行安全考量,平台规划的导航线路并没有采用两点之间直线最短的逻辑,而是结合城市人居分布、地理…

2026-06-03

鼎讯信通OM-036频谱分析仪:精准测试,为风电安全高效运行护航
超低噪声与高相位噪声指标,弱信号清晰识别:具备优异的相位噪声与显示平均噪声电平,在风机强电磁环境下仍可准确捕捉弱覆盖、微小干扰与谐波失真,为覆盖优化提供可靠数据支撑。鼎讯信通OM-036 台式频谱分析仪以实…

2026-06-03

鼎讯信通RM-3000:国产高性能测试仪,筑牢风电无线通信安全防线
鼎讯信通 RM-3000 高性能无线电综合测试仪凭借 3GHz 超宽频覆盖、多功能集成、高精度测试与便携耐用设计,成为风电行业无线信号覆盖检测、设备调试、通信保障的专业装备。高清大屏便携设计,适合野外风电作业…

2026-06-03