ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

摩尔线程助推国产GPU创新:高性能计算库MUTLASS开源亮相

时间:2024-11-12 19:24:08来源:ITBEAR编辑:瑞雪

【ITBEAR】摩尔线程近日宣布,已正式将高性能线性代数模板库MUTLASS开源,旨在助力开发者更高效地为摩尔线程GPU的MUSA Core与Tensor Core等单元进行编程。此举有望加快基于国产GPU的算子开发与算法创新步伐。

MUTLASS的开源,是摩尔线程在开放技术资源方面的又一重要举措。此前,该公司已陆续开源了OpenCV-MUSA计算机视觉库、MooER音频理解大模型以及vLLM-MUSA大语言模型高速推理框架,显示出其对开源社区的支持与投入。

在数值计算和深度学习领域,矩阵乘法及其变种是构建上层复杂应用的基础。然而,为实现更高的算子融合效率或更创新的算法,开发者们常需超越标准计算接口的限制。MUTLASS应运而生,专为满足这一需求而设计。

作为摩尔线程针对自研MUSA架构优化的高性能计算库,MUTLASS基于开源模板库CUTLASS进行了适配和定制化开发。它提供了一系列高性能的C++模板组件,并采用分层分解及数据搬运策略,以确保性能的充分发挥。

此次开源的版本中,摩尔线程为CuTe后端库增加了第三代MUSA架构的MMA计算原语,支持多种数据精度,包括TF32、FP16、BF16和INT8。这些功能为开发者提供了更广泛的选择和灵活性。

借助MUTLASS,开发者们可以灵活复用不同层级的模板组件,并根据需要修改实现细节,以较低的成本实现定制化的高性能算子。这不仅有助于在摩尔线程全功能GPU上充分释放性能,还为算法创新提供了更多可能。

摩尔线程表示,将继续致力于优化MUTLASS的性能,并不断引入新功能,以满足开发者日益增长的需求。

更多热门内容