ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

MosaicML发布300亿参数的MPT-30B语言模型,训练成本大幅降低

时间:2023-06-25 16:25:29来源:ITBEAR编辑:茹茹

【ITBEAR科技资讯】6月25日消息,AI 创业公司MosaicML近日发布了一款名为MPT-30B的语言模型,该模型拥有300亿参数,训练成本远低于其他竞争对手,有望推动AI模型在更广泛领域的应用并逐步降低训练成本。

MosaicML首席执行官兼联合创始人Naveen Rao表示,MPT-30B的训练成本仅为70万美元(约502.44万元人民币),远低于类似产品如GPT-3所需的数千万美元训练成本。该模型由于成本低、体积小,可以更快速地进行训练,并且更适合在本地硬件上部署。

据ITBEAR科技资讯了解,MosaicML采用了Alibi和FlashAttention技术来优化模型,这些技术可以实现更长的文本长度和更高的GPU计算利用率。MosaicML还是少数几个能够使用Nvidia H100 GPU的实验室之一,相较于以往的成果,他们的每块GPU吞吐量提高了2.4倍以上,从而可以更快地完成训练过程。

除了使AI技术更易获取外,MosaicML还专注于提高数据质量并提升模型性能。他们目前正在开发一款工具,可以在预训练过程中逐步引入特定领域的数据,以确保训练中包含多样化且高质量的数据组合。

MosaicML表示,将模型参数扩展到300亿只是第一步,接下来他们将以降低成本为前提,推出更大体积、更高质量的模型。

需要注意的是,开发者可以从Hugging Face下载并使用开源的MPT-30B基础模型,还可以使用自己的数据在本地硬件上进行微调。

更多热门内容
启点智慧景区数字孪生平台:以科技之力,绘就文旅产业智慧升级新画卷
启点创新智慧景区数字孪生管理平台是文旅产业数字化转型的代表性解决方案,其以“数据互联、智能决策、生态共生”为核心理念,通过物联网、大数据、AI、区块链等技术深度融合,构建了覆盖景区资源、客流、设施、服务的全…

2025-10-11

AI国医脑赋能健康服务!俏妃云智护机器人亮相湖南开启智能理疗新篇
骆氏御医第六代传人、中西医双博士后骆敏介绍,这款机器人将传统中医理论与现代人工智能技术相结合,能在短短5秒内精准识别用户身体痛点,其检测精度远超人工触诊;基于强大的AI算法与国医大师的经验赋能,将传统理疗手法…

2025-10-10

“成都造”机器人大显身手:恐龙“复活”,“哪吒”巡游,熊猫“懂情”共赴文旅新篇
红星新闻记者了解到,自成都市第二批次机器人与人工智能实景验证活动启动以来,来自6家企业的13款前沿产品在成都自然博物馆、成都大熊猫繁育研究基地两大标志性文旅场景中“上岗打卡”,不仅为游客带来了别具一格的智能…

2025-10-10