ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

​寒武纪快速适配DeepSeek-V3.2-Exp模型,开源vLLM-MLU引擎助力高效计算​

时间:2025-09-30 15:44:26来源:互联网编辑:快讯

近日,深度求索公司正式推出了一款实验性版本的大模型——DeepSeek-V3.2-Exp。作为人工智能领域的新探索,该模型一经发布便引发了行业广泛关注。与此同时,寒武纪公司宣布已完成对该模型的适配工作,并同步开源了其大模型推理引擎vLLM-MLU的源代码,为开发者提供更高效的工具支持。

寒武纪方面表示,公司始终将大模型软件生态建设作为核心战略之一,致力于为包括DeepSeek在内的主流开源大模型提供技术支撑。凭借长期积累的技术优势和活跃的生态体系,寒武纪在DeepSeek-V3.2-Exp发布当日即实现了模型架构的适配与优化,展现了其快速响应能力。

在技术实现层面,寒武纪通过Triton算子开发框架完成了对DeepSeek-V3.2-Exp的快速适配,同时利用BangC融合算子技术进一步挖掘硬件性能潜力。公司创新性地采用计算与通信并行策略,使模型推理效率达到行业领先水平。这一系列优化措施,结合DeepSeek-V3.2-Exp引入的Sparse Attention机制,显著降低了长序列场景下的训练与推理成本。

此次合作不仅体现了寒武纪在AI芯片领域的深厚积累,也展示了其与生态伙伴协同创新的能力。通过软硬件深度融合,双方共同为客户提供了更具竞争力的解决方案,为人工智能技术在复杂场景中的应用开辟了新路径。

更多热门内容
蚂蚁集团开源Ring-1T-preview大模型,AIME等多测试中表现亮眼
在 AIME 25 测试中,Ring-1T-preview 获得 92.6 分,超越了所有已知开源模型及 Gemini 2.5 Pro,并且接近GPT-5(无工具使用)的 94.6 分。 蚂蚁百灵团队表示,…

2025-09-30

蚂蚁集团开源Ring-1T-preview:预览版性能卓越,正式版训练正酣
在 AIME 25 测试中,Ring-1T-preview 获得 92.6 分,超越了所有已知开源模型及 Gemini 2.5 Pro,并且接近GPT-5(无工具使用)的 94.6 分。 蚂蚁百灵团队表示,…

2025-09-30