ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

DeepSeek开源DSpark及DeepSpec框架,模型生成速度大幅提升并降低落地门槛

时间:2026-06-28 04:48:02来源:互联网编辑:快讯

近日,人工智能领域迎来两项重要技术突破:DeepSeek正式开源推测解码框架DSpark与训练框架DeepSpec,并同步发布基于这两项技术优化的DeepSeek-V4-Pro-DSpark和DeepSeek-V4-Flash-DSpark两款模型。其中DSpark框架由北京大学团队参与联合研发,相关技术论文已对外公开。

DSpark框架的核心创新在于其半自回归架构设计。该架构通过将并行主干网络与轻量化串行模块相结合,在保留并行计算效率优势的同时,建立了块内token的依赖关系。这种设计有效缓解了传统并行解码中常见的末尾内容质量衰减问题。为进一步提升解码稳定性,研发团队引入了动态置信度调度机制,该机制可根据前缀内容的通过概率与系统实时吞吐特征,自动调整校验长度,确保解码过程在速度与质量间取得平衡。

在DeepSeek-V4线上服务系统的部署测试中,DSpark框架展现出显著性能提升。数据显示,在保持系统整体吞吐量不变的前提下,单用户内容生成速度提升幅度达60%至85%。特别值得注意的是,该框架在严格交互时延约束条件下,仍能维持系统吞吐率的稳定性,成功突破了服务系统性能优化的传统边界限制。

同步开源的训练框架DeepSpec则聚焦于降低技术落地门槛。这个全栈代码库整合了数据预处理、模型训练及效果评估的完整工具链,采用MIT开源协议授权。目前该框架已实现对DSpark、DFlash和Eagle3三种推测解码算法的支持。开发者可利用DeepSpec为Qwen3、Gemma等主流模型训练定制化草稿模型,显著简化推测解码技术的实施流程。据开发团队介绍,该框架的模块化设计使其能够快速适配新的模型架构,为AI应用的多样化发展提供技术支撑。

更多热门内容
AI助力宇宙探索:迁移学习加速新物理发现,也面临负迁移挑战
迁移学习允许人工智能系统将从一项任务中获得的知识应用到另一项任务中,以帮助其更高效地学习。这个初始训练过程被称为预训练,为人工智能打下了基础,之后再让它接触包含可能的新物理的更复杂宇宙学模型。 正如作者在论…

2026-06-28

吉林建科携手华为举办产教融合论坛 共探AI时代人才培养新路径
央广网长春6月27日消息(记者张学龙)26日,由华为技术有限公司主办、吉林建筑科技学院承办的“数智赋能·人才兴吉——2026产教融合创新发展论坛暨华为院校人才培养论坛”在吉林建筑科技学院国际会议交流中心举行。…

2026-06-28

清华等多校联手:打破AI“自我确认陷阱”,让智能体真正学会“吃一堑长一智”
提炼经验的AI没有参与任务执行,它不会因为某条行动记录是自己产生的而对它有偏袒,也不会因为自己在某个地方失败了就不愿意承认那是错误。研究团队在论文中坦诚指出了几个值得关注的潜在问题:如果多个不同的AI恰好都存…

2026-06-28

2026企业级智能体开发平台怎么选?四大主流平台深度对比助决策
依据这一评价模型,本文选取市面上4款具备代表性的企业级智能体开发框架,围绕“产品定位-核心优势-适配场景-技术特征”的规范化范式进行深度剖析,以保证对比视角的同一性与逻辑对等。只有将底层算力、模型能力与具体…

2026-06-28

吉翼智能8个月完成技术攻坚:具身机器人进厂,开启智能质检新篇章
发布会首次亮出吉翼双机器人矩阵与自研Z—1具身大模型——后者在Robocasa开源评测中以80.0%的平均得分位列榜首。 从全球汽车零部件供应链的深度参与者,到具身智能赛道的实战派,吉翼智能正以“真实产品、真…

2026-06-28

览邦Watch Ultra深度评测:多场景适配的智能手表新标杆
在智能穿戴设备市场蓬勃发展的当下,智能手表已不再仅仅是看时间的工具,它承载着独立通信、健康监测、娱乐等诸多功能。 综上所述,览邦Watch Ultra在外观设计、核心功能、性能配置、续航能力等方面都有着出色的…

2026-06-28