ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

蚂蚁技术新突破:Ring-lite轻量级MoE推理模型惊艳开源

时间:2025-06-21 16:35:40来源:ITBEAR编辑:快讯团队

蚂蚁技术团队近期宣布了一项重大举措,正式向公众开放了其最新研发的轻量级推理模型——Ring-lite。这款模型在多个推理评测中取得了卓越表现,彰显了MoE(混合专家)架构在推理任务中的巨大潜力。

Ring-lite是在蚂蚁技术团队先前推出的Ling-lite-1.5模型的基础上进一步优化而来。Ling-lite-1.5采用了MoE架构,总参数达到168亿,但有效激活参数仅为27.5亿。而Ring-lite通过引入独创的C3PO强化学习训练方法,成功提升了模型性能,在AIME24/25、LiveCodeBench、CodeForce、GPQA-diamond等多个推理评测中均名列前茅,其表现甚至超越了参数规模为其三倍以下的Dense模型。

在技术创新方面,Ring-lite团队实现了多项突破。他们首创的C3PO强化学习训练方法有效解决了回复长度波动带来的训练难题,显著提高了训练的稳定性和效率。团队还深入探讨了Long-CoT SFT与RL训练的最佳比例,通过引入基于entropy loss的训练策略,平衡了训练效果和样本效率,进一步提升了模型的整体性能。

Ring-lite还解决了多领域数据联合训练的挑战。通过系统对比混合训练与分阶段训练的优劣,该模型在数学、代码、科学三大领域实现了协同提升。在复杂推理任务中,Ring-lite展现出了强大的性能,特别是在数学推理和编程竞赛方面,其得分远超其他对比模型。

为了验证Ring-lite的实际应用能力,蚂蚁技术团队还对其进行了高考数学和物理题的测试。结果显示,Ring-lite在数学全国一卷上的得分接近130分,表现极为出色。

蚂蚁技术团队在开源Ring-lite时,不仅提供了模型权重和训练代码,还承诺将逐步公开所有训练数据集、超参配置以及实验记录。这一举措标志着轻量级MoE推理模型首次实现了全链路透明化,为相关领域的研究人员提供了极为宝贵的参考资源。

感兴趣的研究人员和开发者可以通过以下链接获取Ring-lite的相关信息:

GitHub链接:https://github.com/inclusionAI/Ring

Hugging Face链接:https://huggingface.co/inclusionAI/Ring-lite

ModelScope链接:https://modelscope.cn/models/inclusionAI/Ring-lite

更多热门内容