【ITBEAR】小米公司近日宣布,其自研的大模型MiLM已实现从一代到二代的升级,新模型MiLM2在多项关键技术上取得显著突破,进一步提升了模型性能和应用场景。
据了解,MiLM2在模型参数规模上进行了大幅扩充,同时优化了数据品质和训练策略。新模型不仅支持云边端结合,参数尺寸也更为灵活,最小为0.3B,最大可达30B,满足了不同场景下的需求。
在能力维度上,MiLM2相较于一代模型平均提升了超过45%。特别是在指令跟随、翻译和闲聊等关键能力上,新模型的表现处于业界前列。这一进步对于小米推进“人车家全生态”战略具有重要意义,有助于提升智能生态系统的整体性能。
MiLM2在端侧部署上也取得了新的突破。新模型支持三种推理加速方案,包括大小模型投机、BiTA和Medusa。通过自研量化方案,相较于业界标准,量化损失降低了78%。同时,新模型还支持更长的窗口长度,最长可达200k,进一步提升了长文本处理的效果。
小米大模型团队还构建了通用的能力评测集Mi-LLMBM2.0,对MiLM2进行了全面评估。评测结果显示,新模型在生成、脑暴、对话、问答等多个应用场景下均表现出色。
随着二代大模型的迭代更新,小米在端侧部署技术上也取得了新的进展。新的4B模型已成功在端侧落地应用,进一步提升了端侧大模型的性能。同时,云端也新增了30B模型,以满足更为复杂和多样化的任务需求。
据悉,小米第二代自研大模型的进步和成果已经开始渗透到真实的业务场景中。新模型不仅助力集团内部解决多样化业务需求、实现工作提效,还已在澎湃OS、小爱同学、智能座舱和智能客服等领域开始应用落地。