近日,人工智能领域知名开源模型DeepSeek再次引发行业关注。其线上服务已完成版本升级,新版本DeepSeek-V3.1-Terminus已全面覆盖官方App、网页端、小程序及API接口。此次更新在保持原有性能的基础上,重点优化了语言输出一致性和智能体执行能力。
技术团队针对用户反馈的典型问题展开专项改进。在语言处理层面,新版本显著减少了中英文混杂输出和异常字符生成的情况,输出稳定性较前代提升明显。智能体功能方面,代码处理和搜索执行两大模块的性能得到重点强化,特别是在复杂任务场景下的表现更加可靠。
回溯该模型的发展历程,今年初发布的DeepSeek-R1曾在全球AI社区引发开源热潮。这款模型在数学计算、编程实现和自然语言理解等核心领域展现出与国际顶尖模型抗衡的实力。九月中旬,关于其推理模型训练方法的研究论文登上国际顶级学术期刊《自然》封面,详细阐述了通过强化学习自主构建推理路径的创新训练范式,这种技术路径有效降低了模型训练的复杂度和资源消耗。
在版本迭代进程中,八月下旬推出的DeepSeek-V3.1版本已实现重大技术突破。该版本创新性地采用混合推理架构,支持思考模式与非思考模式的动态切换,在保持高思考效率的同时,大幅提升了智能体工具调用和任务执行能力。测试数据显示,新模型在代码修复基准测试SWE-bench中的表现较前代提升显著,搜索智能体在多学科复杂问题处理上也展现出明显优势。
技术架构方面,DeepSeek-V3.1特别针对国产芯片环境进行了优化适配,采用UE8M0 FP8 Scale参数精度设计,为即将面市的国产新一代AI芯片提供完美支持。这一技术布局直接带动了相关产业链的市场表现,版本发布当日,多家国产芯片企业股价出现明显上涨。
资本市场对此反应积极,证券机构分析指出,DeepSeek的技术演进路径正在重塑国产AI生态。随着模型训练与推理需求向国产芯片迁移,将加速形成自主可控的算力基础设施。特别是在智能体商业化领域,V3.1版本展现出的任务处理能力提升,为金融、医疗、教育等行业的智能化转型提供了新的技术解决方案。