寒武纪快速适配DeepSeek-V3.2-Exp模型，开源vLLM-MLU引擎助力高效计算-人工智能-ITBear科技资讯

近日，深度求索公司正式推出了一款实验性版本的大模型——DeepSeek-V3.2-Exp。作为人工智能领域的新探索，该模型一经发布便引发了行业广泛关注。与此同时，寒武纪公司宣布已完成对该模型的适配工作，并同步开源了其大模型推理引擎vLLM-MLU的源代码，为开发者提供更高效的工具支持。

寒武纪方面表示，公司始终将大模型软件生态建设作为核心战略之一，致力于为包括DeepSeek在内的主流开源大模型提供技术支撑。凭借长期积累的技术优势和活跃的生态体系，寒武纪在DeepSeek-V3.2-Exp发布当日即实现了模型架构的适配与优化，展现了其快速响应能力。

在技术实现层面，寒武纪通过Triton算子开发框架完成了对DeepSeek-V3.2-Exp的快速适配，同时利用BangC融合算子技术进一步挖掘硬件性能潜力。公司创新性地采用计算与通信并行策略，使模型推理效率达到行业领先水平。这一系列优化措施，结合DeepSeek-V3.2-Exp引入的Sparse Attention机制，显著降低了长序列场景下的训练与推理成本。

此次合作不仅体现了寒武纪在AI芯片领域的深厚积累，也展示了其与生态伙伴协同创新的能力。通过软硬件深度融合，双方共同为客户提供了更具竞争力的解决方案，为人工智能技术在复杂场景中的应用开辟了新路径。

​寒武纪快速适配DeepSeek-V3.2-Exp模型，开源vLLM-MLU引擎助力高效计算​

寒武纪快速适配DeepSeek-V3.2-Exp模型，开源vLLM-MLU引擎助力高效计算