ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

DeepSeek融资后发力工程优化:DSpark框架让大模型推理提速最高达85%

时间:2026-06-29 03:38:20来源:快讯编辑:快讯

在生成式人工智能领域,DeepSeek团队与北京大学近日联合发布了一项重要研究成果——论文《DSpark: Confidence-Scheduled Speculative Decoding with Semi-Autoregressive Generation》,提出了一种名为DSpark的新型推测解码框架,为提升大语言模型推理效率开辟了新路径。

不同于传统模型迭代方式,DSpark并未对DeepSeek-V4-Pro和V4-Flash进行架构升级,而是通过工程优化在现有模型中嵌入推测解码模块。该框架已全面部署于DeepSeek线上服务,经真实用户流量验证,在保持系统总吞吐不变的情况下,V4-Flash单用户生成速度提升60%-85%,V4-Pro提升57%-78%。更值得关注的是,这项技术已扩展至阿里Qwen3-4B/8B/14B和Gemma4-12B等主流模型,覆盖数学推理、代码生成、日常对话三大核心场景。

技术突破体现在两大创新机制:半自回归生成架构通过引入轻量级串行模块,在保持并行主干高吞吐优势的同时,解决了并行草稿模型依赖缺失导致的多模态冲突问题;置信度调度验证机制则通过动态评估每个token的存活概率,结合硬件感知调度器,实现了验证长度的智能优化。实验数据显示,DSpark在所有测试模型和场景中均超越Eagle3和DFlash基线,以Qwen3系列为例,宏平均接受长度提升达16.3%-30.9%。

配套开源的DeepSpec代码库成为该技术的另一亮点。这个全栈工具包包含数据准备、模型训练、评估脚本等完整组件,支持MIT开源协议,内置DSpark、DFlash和Eagle3三种实现方案。对于缺乏算法研发能力的中小企业而言,这意味着可直接复用经过验证的推理优化方案,显著降低大模型私有化部署的技术门槛和成本投入。

研究团队特别指出,不同应用场景对技术方案的需求存在显著差异。结构化任务如数学推理和代码生成中,模型可接受更长的生成序列,而开放式对话场景的平均接受长度明显偏低。这种领域特异性要求推理优化框架必须具备跨场景适应能力,DSpark通过动态调整生成策略,在各类任务中均保持了稳定性能。

当前方案仍存在优化空间。对于预测性极低的复杂查询,前置草稿模型的算力利用率有待提升。研究团队提出在草稿模型中引入难度感知机制,使系统能够自动跳过低价值请求的完整生成流程,进一步优化资源分配效率。这种"不拼参数拼速度"的技术路线,恰好契合了生成式AI从实验室走向产业化的关键需求。

随着DSpark框架的开源推广,大模型推理效率的竞争格局正在发生深刻变化。当行业普遍聚焦模型参数规模时,DeepSeek选择通过工程优化提升实际部署效能,这种差异化策略为AI商业化落地提供了新的参考范式。特别是在算力成本高企的当下,如何在保证性能的前提下降低资源消耗,已成为决定技术产品市场竞争力的重要因素。

更多热门内容
B站17周年陈睿演讲:优质内容成增长引擎,UP主充电收入大涨71.1%
新榜讯 6月27日讯,哔哩哔哩(下称“B站”)今日迎来成立17周年。在周年庆现场,B站董事长兼CEO陈睿发表了题为“让好内容发生”的演讲。陈睿指出,尽管当下内容供给已呈过剩态势,但用户对优质内容的渴望依旧强烈…

2026-06-29

周鸿祎谈AI落地困境:组织不革新、防御不升级,新技术难成生产力引擎
周鸿祎分享了一个让他困惑的现象:有些公司人人都在用AI编程工具,人人都消耗大量Token,个人代码提交量显著增加,但整个组织的效率并没有提升。在个人手中,越用越聪明是优点;但在企业内部,买了一个软件用了一年…

2026-06-29

智元第15000台具身机器人下线 具身智能产业开启规模化商业部署新篇
不到3个月前,智元刚刚在这片量产基地庆祝了第10000台机器人的下线;仅90天后,这一数字便被刷新到了15000台,再次创下全球具身智能机器人量产规模与速度的新纪录。 从3年前实验室里“形单影只”的6台原型…

2026-06-29

360发布“图龙锋”“仪天阵” 助力政企单位掌握AI时代安全主动权
面对AI自动化攻击带来的新挑战,360现场披露漏洞挖掘智能体“图龙锋”和网络安全自动化防御系统“仪天阵”,以智能体蜂群路线帮助政企单位掌握安全主动权。 大会现场,360正式展示漏洞挖掘智能体“图龙锋”,它是3…

2026-06-29

VR跑步机Omni One牵手Meta Quest:原生支持开启沉浸运动新体验
IT之家 6 月 28 日消息,制造商 Virtuix 宣布正式为旗下消费级 VR 跑步机 Omni One 引入原生 Meta Quest头显支持,产品同步加入 Meta 官方“Made for Meta…

2026-06-29

红米Note17系列来袭,超大杯或配万级电池,千元机市场要变天?
红米Note17系列正式入网,发布时间暂定2026年7月份,其中超大杯有望改名Note17 ProMax,同时它也是小米首款电池容量过万的机型。红米Note17 Pro Max属于它的竞品,理智分析的话天玑…

2026-06-29

iOS 27 Beta 2现百度视觉搜索组件,AI升级与折叠屏布局成新亮点
据悉,在这次的iOS 27升级中,苹果带来了AI方面的全新功能。 根据官方数据,升级iOS 27后,iPhone和iPadApp的打开速度最高提升30%,新照片的显示速度最高提升70%,且iPhone 1…

2026-06-29