近年来,我国在人工智能技术领域的进展显著,多款新发布的大模型已达到国际顶尖水平,与此同时,AI芯片企业也积极行动,致力于与各大国产大模型进行适配,共同推动智能计算产业生态的构建。作为国家级的技术验证平台,中国信息通信研究院通过“人工智能芯片测试评估公共服务平台”,建立了AI芯片与大模型协同适配的标准化体系,为产业链上下游的深度合作提供了重要支撑,并积极开展适配验证工作,通过一系列措施促进了AI芯片与大模型的协同发展。
中国信息通信研究院近期宣布,摩尔线程自主研发的训推一体计算卡MTT S4000与杭州深度求索人工智能基础技术研究有限公司研发的DeepSeek-R1 671B大模型,在推理场景下的适配结果已经满足“AI芯片和大模型通过性适配要求”,成功通过中国信通院的《AI芯片和大模型适配能力通过性评测软硬件环境及测试细则》推理场景验证。摩尔线程MTT S4000不仅运行稳定,满足推理使用需求,还获得了相应的检测证书。目前,摩尔线程系列训推一体计算卡正在进一步优化性适配验证,相关结果将在后续公布。
MTT S4000是基于摩尔线程的全功能GPU架构设计的,是专为大模型打造的训推一体通用计算卡。它支持多种计算精度,包括FP64、FP32、TF32、FP16、BF16和INT8,并配备了48GB的高性能显存。凭借摩尔线程自研的MTLink1.0技术,MTT S4000可以实现多卡互联及千卡集群部署,为千亿参数大模型的训练、微调和推理提供强大的算力支持。MTT S4000还具备先进的图形渲染、视频编解码和超高清8K HDR显示能力,能够满足人工智能、科学计算、多媒体处理等复合场景的需求。
摩尔线程能够迅速完成DeepSeek R1-671B大模型的适配验证,主要得益于其完善的MUSA生态软件栈和高效的开发实践。这包括vLLM_MUSA推理框架、MUTLASS、Triton-MUSA等,这些技术优势不仅展示了MUSA软件栈的高效适配能力,还使其整体性能达到了行业主流水平。这也进一步证明了摩尔线程在国产GPU技术创新和生态建设方面的强大实力。
最近,摩尔线程还推出了搭载MTT S4000的MCCX DeepSeek大模型一体机。这款产品深度融合了国产全功能GPU、深度优化的高性能推理引擎和软件栈,全面支持从蒸馏版到671B参数全量版的DeepSeek模型部署需求。它可以灵活适配广泛的行业、场景和应用,通过摩尔线程的自主技术链,实现开箱即用、安全可控的一站式大模型服务。这不仅为政企客户提供了高效易用的国产化AI基础设施,还显著降低了大模型的应用门槛。