ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

DeepSeek V4七月中旬上线,峰谷定价与DSpark技术双轮驱动升级

时间:2026-06-30 06:33:06来源:互联网编辑:快讯

DeepSeek近期在产品迭代与技术开源领域双线发力,正式版V4模型与推理加速框架DSpark的同步推进,标志着这家AI企业在商业化与技术突破间找到新的平衡点。7月中旬即将上线的V4正式版不仅在功能上进一步优化,更引入峰谷定价机制,而与北京大学联合研发的DSpark框架已实现线上全量部署,显著提升模型推理效率。

V4系列模型分为旗舰版V4-Pro与轻量版V4-Flash,前者参数量达1.6万亿,激活参数490亿,预训练数据量33万亿字节,支持百万字上下文处理;后者参数量2840亿,激活参数130亿,预训练数据32万亿字节,同样具备百万字上下文能力。两款模型均已开源并提供API服务,其中V4-Pro在网页端以专家模式运行,V4-Flash则采用快速模式,满足不同场景需求。

峰谷定价机制成为此次更新的核心变量。根据新规,API使用成本将按时段划分:每日9时至12时、14时至18时为高峰时段,收费翻倍;其余时段维持现行价格。这一策略旨在通过价格杠杆引导用户错峰使用,优化资源分配。对于必须在工作时段密集调用API的企业用户,成本将直接上升;而具备任务调度能力的用户则可通过迁移至低峰时段维持原有支出水平。

技术层面,DSpark框架的落地为模型推理效率带来质的飞跃。实测数据显示,部署DSpark后,V4-Flash单用户生成速度提升60%至85%,V4-Pro提升57%至78%。这一成果源于框架对推测性解码技术的工程化优化——通过轻量级小模型快速生成候选token,再由大模型并行验证,在保证生成质量的前提下大幅提升速度。该框架已作为全栈推测性解码工具链DeepSpec开源,论文由创始人梁文锋署名并上传至公开代码库。

DSpark的创新集中在两大技术瓶颈的突破。针对并行生成中“后缀衰减”问题,框架采用“并行主干+轻量串行头”的两阶段设计:并行部分保留速度优势,串行模块补充相邻token间的依赖关系,修正语义冲突。测试表明,2层深度的DSpark有效接受长度甚至超过5层深度的纯并行方案。另一创新是置信度调度验证机制,通过在草稿模型中嵌入置信度评分模块,实时预测候选token的接受概率,并将评分误差压缩至1%以内。调度器据此动态调整验证长度,低并发时拉满算力,高并发时裁剪低价值token,避免资源争抢。

对于API用户而言,峰谷定价将直接推高工作时段的使用成本,但推理速度的提升或可在高并发场景下部分抵消这一压力。开发者则受益于DSpark的开源特性,其工程化落地方案降低了推理优化的技术门槛,为行业提供了可复用的技术路径。这一系列动作显示,DeepSeek正通过技术突破与商业策略的协同,在激烈的市场竞争中构建差异化优势。

更多热门内容
深演智能DeepAgent 4.0 Pro:让AI从效率工具跃升为业务增长引擎
深演智能指出,内容中台真正的价值不在于跑通某一条分发链路,而在于让内容第一次成为可被AI反复调用、持续沉淀与优化的底座——这是企业一切与内容相关的AI应用能否真正跑起来的前提。智能导购机器人将DeepAgen…

2026-06-30

机器人与芯片双轮驱动,广州经济转型焕新,高端制造科创高地崛起
从产业结构来看,石油化工、汽车制造、电器机械等细分产业均实现正增长,但真正拉动大盘的,不再是传统产业,而是一股新锐力量——高新技术制造业,其增加值增速显著跑赢全市规上工业平均水平。 1-5月广州集成电路制造…

2026-06-30

软银强势回归机器人赛道:量产开启新局 百亿并购冲刺全球物理AI制高点
孙正义也明确表态,收购ABB核心目的,是打通AI算法与实体机器人的技术壁垒,依托硬核硬件实力,抢占全球物理AI产业制高点。随着机器人量产落地、ABB收购顺利推进,全球AI+机器人产业格局或将迎来大洗牌,物理A…

2026-06-30

荣德机器人:20余年深耕喷涂领域,“专精特新”打造智能喷涂优选方案
专业领域深耕者:如深圳市荣德机器人科技有限公司,他们不追求大而全,而是聚焦于喷涂这一垂直领域,深耕特定行业(如磁材、PCB、家电等),通过极致专业化和定制化解决方案,构建了自身坚实的护城河。 在众多优秀的国产…

2026-06-30

Diver-X下月初更名前推出新品:VR控制手套与机器人数据手套亮相
IT之家 6 月 29 日消息,即将在下月初更名为 Melt Interface 的日本企业 Diver-X 当地时间本月 24 日宣布推出ContactGlove3 手套式 VR 控制器和 Contact…

2026-06-30