ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

DeepSeek-V4预览版上线开源:百万字上下文,Pro与Flash双版本齐发

时间:2026-04-24 13:48:57来源:互联网编辑:快讯

DeepSeek 正式发布全新系列模型 DeepSeek-V4 的预览版本,并同步开源,为人工智能领域带来新的突破。该模型具备百万字超长上下文处理能力,在 Agent 能力、世界知识储备以及推理性能方面均达到国内开源领域的领先水平。

DeepSeek-V4 系列模型分为两个版本:DeepSeek-V4-Pro 和 DeepSeek-V4-Flash。官方介绍,DeepSeek-V4 开创了一种全新的注意力机制,通过在 token 维度进行压缩,并结合 DSA 稀疏注意力技术,实现了全球领先的长上下文处理能力,同时大幅降低了对计算资源和显存的需求。从即日起,100 万上下文将成为 DeepSeek 所有官方服务的标准配置。

在 API 服务方面,DeepSeek 已同步完成更新。用户只需将 model_name 修改为 deepseek-v4-pro 或 deepseek-v4-flash,即可调用相应版本的模型服务。

DeepSeek-V4-Pro 在 Agent 能力上表现尤为突出。在 Agentic Coding 评测中,该模型已达到当前开源模型的最佳水平,并在其他 Agent 相关评测中同样取得优异成绩。目前,DeepSeek-V4-Pro 已成为公司内部员工使用的 Agentic Coding 模型。据评测反馈,其使用体验优于 Sonnet 4.5,交付质量接近 Opus 4.6 非思考模式,但与 Opus 4.6 思考模式仍存在一定差距。

在世界知识测评中,DeepSeek-V4-Pro 的表现同样亮眼,大幅领先其他开源模型,仅稍逊于顶尖闭源模型 Gemini-Pro-3.1。而在数学、STEM 以及竞赛型代码的测评中,该模型更是超越了所有已公开评测的开源模型,成绩可与世界顶级闭源模型媲美。

相比之下,DeepSeek-V4-Flash 在世界知识储备方面略逊于 Pro 版本,但其推理能力与之接近。由于模型参数和激活量较小,V4-Flash 能够提供更快捷、经济的 API 服务,满足对成本和效率有较高要求的用户需求。

在 Agent 测评中,DeepSeek-V4-Flash 在简单任务上的表现与 Pro 版本不相上下,但在处理高难度任务时仍存在一定差距。这一特点使得 V4-Flash 更适合对计算资源有限制或对任务复杂度要求不高的场景。

更多热门内容
MiniMax5月29日签约辅导协议 正式踏上A股IPO新征程
国内人工智能领域迎来新动态,知名企业MiniMax正式踏上A股上市征程。5月29日,该公司与中信证券达成合作,双方签署了辅导协议,标志着其A股IPO进程正式拉开帷幕。 据了解,MiniMax在人工智能领域深耕多年,凭借先进的技术和创新的业务模式,在市场上占据了一席之地。此前,该公司已在港股市场成功上市,积累了丰富的资本市场经验,也为此次冲击A股市场奠定了坚实基础。

2026-05-30

科技赋能文旅新体验:黄山智游黄山景,泰山外骨骼助登峰
本土大模型在场景适配层面拥有明显优势,能够结合黄山本地的文旅特色、地域文化不断优化服务内容,针对山岳景区特有的天气变化、山道通行规则、安全提示等内容进行深度打磨,让智能服务不再是通用模板的套用,而是真正扎根于…

2026-05-30

宇树科技亚洲首店落户南京西路商圈,主力机器人亮相,邀消费者沉浸式体验未来科技
本周日,宇树科技具身智能体验馆亚洲首店,将在南京西路商圈久光百货二楼亮相开业,记者今天到店先睹:作为宇树科技面向大众消费市场的重要窗口,门店将集中展示并销售G1人形机器人、R1人形机器人、Go2 机器狗等…

2026-05-30

科技赋能文旅新体验:黄山智解山水密码,泰山外骨骼助力攀登新风尚
本土大模型在场景适配层面拥有明显优势,能够结合黄山本地的文旅特色、地域文化不断优化服务内容,针对山岳景区特有的天气变化、山道通行规则、安全提示等内容进行深度打磨,让智能服务不再是通用模板的套用,而是真正扎根于…

2026-05-30

探访国家人工智能中试基地:具身智能机器人“训练”正酣
参观者在国家人工智能应用中试基地(具身智能)展厅内与机器人互动(5月29日摄)。 在位于浙江省杭州市的国家人工智能应用中试基地(具身智能),多款具身智能机器人开展多样化训练:有的在家庭仿真场景中学习识别、抓…

2026-05-30