蚂蚁集团旗下的百灵大模型团队在近期举办的蚂蚁技术日上,向外界公布了一项重大决策:他们决定全面开源其多模态大模型Ming-lite-omni。此举不仅彰显了蚂蚁集团在人工智能领域的开放姿态,更在业界引起了轰动,被视为首个在模态支持能力上能够媲美GPT-4o的开源模型。
Ming-lite-omni是基于Ling-lite构建而成的,它采用了前沿的MoE(专家混合)架构,拥有惊人的220亿总参数和30亿激活参数。这一参数规模在当前的开源多模态模型中堪称翘楚,充分展示了蚂蚁集团在大模型技术领域的深厚底蕴。
值得注意的是,Ming-lite-omni的模型权重和推理代码已经面向公众全面开放,未来还将陆续发布训练代码和训练数据。这一举措无疑为全球开发者提供了宝贵的技术资源,助力他们在人工智能领域取得更多突破。
事实上,百灵大模型团队今年的开源步伐从未停歇。他们先后推出了Ling-lite、Ling-plus等大语言模型,以及多模态大模型Ming-lite-uni和预览版Ming-lite-omni。特别是五月中旬开源的Ling-lite-1.5版本,其能力已经接近同水位的SOTA水平,性能介于千问4B和8B之间。这一成果成功验证了300B尺寸SOTA MoE大语言模型在非高端算力平台上训练的可行性。
在多项理解和生成能力的评测中,Ming-lite-omni的表现与10B量级的多模态大模型相当甚至更优。蚂蚁集团自豪地表示,Ming-lite-omni是目前已知首个在模态支持方面能够与GPT-4o相媲美的开源模型。这一成就不仅为全球开发者提供了重要的技术选择,更为他们树立了新的参考标准。
百灵大模型团队的负责人西亭在介绍技术路线时强调:“我们始终坚定地在语言大模型和多模态大模型上统一使用MoE架构,并充分利用非高端算力平台。这一策略成功证明了国产GPU在训练可比拟GPT-4o模型方面的潜力。”