ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

DeepSeek R1模型升级,思维深度跃升,幻觉率大幅下降!

时间:2025-05-30 11:47:24来源:ITBEAR编辑:快讯

DeepSeek公司近期宣布,其DeepSeek R1模型已经完成了新一轮的小版本升级,新版本命名为DeepSeek-R1-0528。此次升级不仅引起了业界的广泛关注,还带来了多项能力的提升。

据了解,在28日晚上,DeepSeek通过官方渠道突然发布消息,称DeepSeek R1模型的小版本试升级已经完成,并邀请用户前往官方网站、App及小程序进行测试。这一消息迅速在行业内传播开来,引发了众多用户的试用热潮。

与此同时,TechWeb也对新版DeepSeek-R1模型进行了亲测和用户试用体验的报道,指出新版模型在代码能力方面表现出色,但在写作幻觉方面仍有待改进。报道还提供了详细的测试链接,供读者进一步了解。

DeepSeek官方对DeepSeek-R1-0528的能力进行了详细介绍。新版本依然基于2024年12月发布的DeepSeek V3 Base模型,但在后训练过程中增加了更多的算力投入,使得模型的思维深度和推理能力得到了显著提升。

据官方透露,更新后的R1模型在数学、编程及通用逻辑等多个基准测评中取得了优异成绩,整体表现已接近国际顶尖模型,如o3和Gemini-2.5-Pro。特别是在AIME 2025测试中,新版模型的准确率从旧版的70%提升至87.5%,这一进步得益于模型在推理过程中思维深度的增强。

DeepSeek团队还利用DeepSeek-R1-0528的思维链后训练了Qwen3-8B Base,得到了DeepSeek-R1-0528-Qwen3-8B。该8B模型在数学测试AIME 2024中的表现仅次于DeepSeek-R1-0528,超越了Qwen3-8B,与Qwen3-235B相当。DeepSeek团队认为,这一思维链对于学术界推理模型的研究和工业界小模型的开发都具有重要意义。

除了推理能力的提升,新版DeepSeek R1还在其他方面进行了优化。针对“幻觉”问题,新版模型在改写润色、总结摘要、阅读理解等场景中,幻觉率降低了约45%~50%,能够提供更准确、可靠的结果。同时,在创意写作方面,新版模型能够输出篇幅更长、结构内容更完整的长篇作品,写作风格也更加贴近人类偏好。

在工具调用方面,DeepSeek-R1-0528支持工具调用,但暂不支持在思考过程中进行工具调用。当前模型的Tau-Bench测评成绩与OpenAI o1-high相当,但与o3-High及Claude 4 Sonnet仍有差距。新版R1在前端代码生成、角色扮演等领域的能力也有所提升。

API方面,新版R1 API已同步更新,接口与调用方式保持不变。同时,新版API增加了Function Calling和JsonOutput的支持,并对max_tokens参数的含义进行了调整。现在,max_tokens用于限制模型单次输出的总长度(包括思考过程),默认为32K,最大为64K。API用户需及时调整max_tokens参数,以防输出被提前截断。

虽然官方网站、小程序、App端和API中的模型上下文长度仍为64K,但用户如有更长上下文长度的需求,可通过第三方平台调用上下文长度为128K的开源版本R1-0528模型。

在模型开源方面,DeepSeek-R1-0528与之前的DeepSeek-R1使用相同的base模型,仅改进了后训练方法。私有化部署时,用户只需更新checkpoint和tokenizer_config.json(tool calls相关变动)。模型参数为685B(其中14B为MTP层),开源版本上下文长度为128K(网页端、App和API提供64K上下文)。

此次开源仓库(包括模型权重)依然采用MIT License,并允许用户利用模型输出、通过模型蒸馏等方式训练其他模型。

更多热门内容
真我GT8系列10月登场,设计大调整,2K直屏等配置或带来超强产品力
IT之家 9 月 22 日消息,真我手机今日官宣,真我 GT8 系列将于 10 月发布,口号为“玩出点名堂”。他还表示,GT系列设计会做很大的调整,GT8 系列“一定有惊喜”。 根据博主 @数码闲聊站 爆料…

2025-09-22

雷军9月25日年度演讲聚焦《改变》 小米17系列三款机型将同步亮相
聊聊小米玄戒芯片和小米汽车背后的故事。 如果不出意外的话,小米17系列手机也将会在此时正式发布,毕竟小米没有必要再开一场专门的发布会。小米17Pro则是一款精湛的小尺寸科技影像旗舰;小米 17 Pro Ma…

2025-09-22

真我GT8系列10月登场:标准版续航强,Pro版2亿潜望长焦亮眼
2025年9月22日,真我手机官微发布消息称,真我GT8系列将于10月正式发布,宣传口号为“玩出点名堂”。据了解,真我GT8系列包含标准版与Pro版。 Pro版则搭载顶尖3nm工艺芯片,屏幕升级为2K LT…

2025-09-22

雷军官宣小米17系列9月25日发布,卢伟冰透露背屏设计投入10亿且独具特色
9月19日,小米品牌总经理卢伟冰针对小米17系列大家最关心的17个话题,公开进行直播回应。 卢伟冰将小米17与iPhone17真机进行对比,并表示两款手机不一样的是,小米17系列有背屏,“我觉得我们这一次…

2025-09-22

华为WATCH GT 6系列9月24日登场:无界美学+21天续航+情绪健康新体验
此次预热内容迅速引发广泛关注,不仅因代言人吴磊与国际健身达人帕梅拉联袂出镜,更因其释放出21天超长续航以及情绪健康监测功能或许带来新升级的信息,以及延续GT系列一贯高颜值的设计语言,让这款新品未发先火,成为当…

2025-09-22

佳明本能・跨界AMOLED系列指针智能手表来袭,独特设计加硬核配置4680元起售
IT之家 9 月 22 日消息,佳明今天发布了本能・跨界 AMOLED 系列指针智能手表,主打独特外观风格、苛刻环境使用,建议零售价 4680元起。 据佳明介绍,这款手表融合了经典腕表的外观和 OLED 显…

2025-09-22

‍雷军官宣9月25日发布小米17系列,全系跨代升级对标iPhone17系列‍
9月25日晚7点发布。”卢伟冰表示:这将是小米手机数字系列史上最重大的一次跃迁,也比上代又提前了一个月发布。 卢伟冰称,小米17系列,是小米高端化五年的蜕变之作,也迎来了数字系列的关键变阵,全系产品力跨代升级…

2025-09-22

小米汽车携手苹果深度合作 苹果授权Apple Music安卓版向多款车型推送
小米汽车在文章提到,当发现SU7车主中有超过50%使用苹果手机时,我们更加明确了一点,苹果用户的用车体验也需要着重关注。此外,小米YU7还适配了经苹果授权的Apple Music安卓版,苹果用户可在YU7…

2025-09-22

苹果iOS 26更新:新增USB权限控制,有效抵御公共充电数据盗窃风险
具体来说,在 iOS 26 中,每当用户用数据线连接配件或电脑时,系统都会弹窗,让用户选择是否允许数据传输: 同时用户还可以在“设置”-->“隐私与安全性”-->“有线配件”中调整这个机制的默认选项,IT之…

2025-09-22

华为MatePad Mini鸿蒙5.1.0.111更新:AI功能上新,系统游戏体验再升级
IT之家 9 月 22 日消息,据IT之家小伙伴反馈,华为 MatePad Mini平板现已获得鸿蒙 5.1.0.111更新,为“图库”、“阅读”等自带应用增添功能,优化部分系统组件。 支持“人像精修”功能…

2025-09-22