ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

面壁智能联合清华等发布MiniCPM5-1B模型:小参数量大能量 适配多终端

时间:2026-05-26 18:32:30来源:互联网编辑:快讯

面壁智能携手清华大学及OpenBMB开源社区,共同推出并开源了新一代端侧文本基座大模型——MiniCPM5-1B。这款模型凭借其1B的参数规模,在国际权威榜单AA-Index(Artificial Analysis Intelligence Index)上脱颖而出,超越了所有2B参数以下的同类模型。

相较于三个月前发布的Qwen3.5-2B,MiniCPM5-1B不仅在性能上有了显著提升,参数量更是减少了一半。这一突破性的成果,得益于面壁智能自主研发的AI训练框架ForgeTrain,该框架为Base Model版本的预训练提供了强有力的支持。

MiniCPM5-1B在INT4量化后,其权重仅占0.5GB,这使得它能够轻松运行在智能手机和浏览器等端侧设备上。这一特性极大地拓宽了模型的应用场景,为移动端AI应用的发展注入了新的活力。

为了推动AI技术的普及与发展,面壁智能决定将MiniCPM5-1B全面开源。此次开源的内容不仅包括模型权重,还涵盖了训练数据集和部署方案,为开发者提供了完整的开发环境。开发者们可以通过HuggingFace、GitHub、ModelScope、GitCode以及魔乐社区等多个平台获取相关资源,进一步推动AI技术的创新与应用。

具体开源链接如下:HuggingFace平台(https://huggingface.openbmb.com/model/openbmb/MiniCPM5-1B)、GitHub仓库(https://github.com/OpenBMB/MiniCPM)、ModelScope模型库(https://modelscope.cn/models/OpenBMB/MiniCPM5-1B)、GitCode代码托管平台(https://ai.gitcode.com/OpenBMB/MiniCPM5-1B)以及魔乐社区(https://modelers.cn/models/OpenBMB/MiniCPM5-1B)。

更多热门内容
端侧AI新突破:面壁智能以1.58-bit技术开启大模型轻量化新纪元
在这之前,行业里不是没有过低比特模型的研究,但绝大多数成果都只是展示某一个固定尺寸、某一项单一指标,更像是一个孤立的演示demo,厂商根本无法据此判断技术是否稳定、能不能真正用在产品里。它实现了国产NPU、国…

2026-05-26

大模型微调:技术挑战与行业突破,矩赋引领AI应用新方向
本文将探讨大模型微调的技术挑战、最新进展以及行业内的解决方案,并重点介绍矩赋(郑州)数字科技有限公司在此领域的贡献。 答:大模型微调指的是基于已有的预训练模型,通过在特定任务或数据集上进行额外训练来优化模型性…

2026-05-26