ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

DeepSeek-V3.1-Terminus发布:修复Bug,编程与搜索智能体能力再升级

时间:2025-09-23 03:35:11来源:小AI编辑:快讯

人工智能领域再迎重要进展,DeepSeek团队近日宣布推出新一代大语言模型DeepSeek-V3.1-Terminus,并同步开源模型代码。这款被命名为"Terminus"(拉丁语意为"终点"或"界限")的模型,在官方技术文档中被描述为现有架构的成熟版本,标志着该技术路线进入稳定阶段。

据官方披露,新模型在保持原有功能的基础上,重点修复了此前版本存在的两个关键缺陷。其一,针对用户反馈的随机异常字符输出问题,团队通过优化模型训练机制,彻底解决了在特定场景下可能出现的"极"、"extreme"等无意义字符重复现象。测试数据显示,在涉及Go语言编程、版本号处理等高危场景中,新模型未再出现异常输出。

另一个被修复的缺陷涉及多语言处理。此前版本在翻译小语种内容时,存在中、英、俄三种语言混用的情况,错误比例最高达5%。新模型通过强化语言边界识别能力,显著提升了翻译准确性。实测表明,在将包含复杂语义的句子翻译为7种小语种时,未出现语言混杂现象。

性能提升方面,基准测试显示新模型在非Agent类任务中实现0.2%-36.5%的性能提升。特别是在人类终极测试(HLE)中,模型展现出更强的专家级知识掌握能力和多模态推理水平。该测试重点考察模型处理高难度知识问题和深度推理的能力,新模型在此环节的表现提升尤为突出。

在智能体能力优化方面,新模型展现出显著进步。编程测试中,模型成功实现了具有物理效果的小球弹跳动画,其模拟的重力、摩擦力等物理特性获得专业人士认可。这项测试不仅要求模型具备扎实的编程基础,更需要其对物理学原理有准确理解。

搜索智能体能力测试显示,新模型在信息交叉验证和整合方面表现优异。当被要求推荐适合新手阳台种植的可食用植物时,模型能够准确筛选出同时满足"生长快速"、"对儿童安全"等条件的植物品种,并主动提示相关种植注意事项。经人工核查,其提供的信息完整且可靠。

目前,DeepSeek官方App、网页端、小程序及API接口均已完成模型升级。开发者可通过HuggingFace和ModelScope平台获取开源代码。技术团队透露,新模型的命名可能暗示着当前技术路线的成熟,但关于"Terminus"的具体寓意,官方尚未给出明确解释。

值得注意的是,此前有海外媒体报道DeepSeek计划在年底前推出Agent模型。随着本次升级的完成,业界普遍关注该团队是否会加速推进更复杂的智能体技术研发。新模型在编程终端和跨模态推理方面的突破,为后续发展奠定了技术基础。

更多热门内容
人工智能投资新视角:大模型进阶智能体,场景化应用前景展望
今天分享的是:人工智能专题:从大模型到智能体——人工智能+场景的投资展望 报告共计:31页 《人工智能专题:从大模型到智能体——人工智能+场景的投资展望》报告首先探讨“什么是真正的人工智能”,指出大语言模型如…

2025-09-23

京东王竞凡:智能机器人高速发展,中国机器人市场2028年或达千亿
来源:睿见Economy 9月16日-17日,聚合智能产业发展大会(2025)在武汉市举行,主题为“协同融合创新链产业链推动聚合智能产业发展”。 王竞凡指出,目前智能机器人处于一个前所未有的高速发展道路,智…

2025-09-23

上海创智学院周年庆发布模速空间AI工作站 助力教育大模型终端化应用
会上,学院正式发布标杆成果——模速空间AI工作站,该设备搭载上海“启创·InnoSpark”人工智能教育大模型,以“端侧算力+教育大模型+场景化应用”三位一体架构,为教育领域注入智能新动能。该工作站由英和智临…

2025-09-23

国内AI大模型迈向“用起来”阶段,央(国)企集约共享大模型前景与挑战并存
通信世界网消息(CWW)目前,国内AI大模型产业正从“百模大战”的“建起来”阶段,向“行业爆发”的“用起来”阶段过渡。权威机构发布的数据显示,2025年一季度国内大模型市场规模预计突破495亿元人民币,但AI…

2025-09-23

百度智能云开源Qianfan-VL视觉模型,多尺寸适配+自研芯片助力多场景应用
在 ScienceQA 等专业问答测试中,精准度表现突出;多模态任务如 RefCOCO 等,物体识别与关联能力优异;同时,在各类通用基准测试里,相较主流模型,整体表现也颇为亮眼,充分彰显出在视觉理解通用能力上…

2025-09-23

工业互联网浪潮涌动 中国电信云网融合赋能工业智能化升级
长期以来,中国电信立足自身优势,坚持以云网融合为核心抓手,在持续夯实工业智能底座、筑牢产业数字化根基的同时,不断加大科技创新力度,通过技术突破与模式创新,为工业企业提供全链条智能化解决方案,有效赋能工业生产全…

2025-09-23