ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

蚂蚁集团开源Ling-Coder-Lite,代码大模型推理效率翻倍

时间:2025-03-29 08:14:22来源:ITBEAR编辑:快讯团队

蚂蚁集团近日宣布了一项重要开源举措,正式推出了Ling-Coder-Lite,这是一款基于MoE(混合专家)架构的代码大语言模型。

据官方详细阐述,Ling-Coder-Lite在推理效率上实现了显著提升,具体提升幅度达到了1.5至2倍。这一成果无疑为代码生成和处理领域带来了新的突破。

值得注意的是,蚂蚁集团此次不仅开源了Ling-Coder-Lite,还同步推出了其轻量级版本Ling-Coder-Lite-Base。这两款模型均已在Hugging Face与ModelScope平台上对外开放,供开发者和研究人员自由使用。

为了支持社区对这两款模型进行更深入的研究和开发,蚂蚁集团还慷慨地开源了大量相关数据。这包括用于退火训练的SyntheticQA数据集,以及用于后训练的SFT(监督微调)和DPO(直接偏好优化)数据集,总数据量高达约3000万条。

Ling-Coder-Lite基于先进的Ling-MoE架构打造,其总参数量达到了16.8B(十六十八亿),但在推理过程中实际激活的参数仅为2.75B(二十七亿五千万)。这一设计使得模型在保持强大性能的同时,也具备了高效的推理能力。

在功能方面,Ling-Coder-Lite展现出了极高的多样性和实用性。它支持Python、Java、C++等数十种常用编程语言,能够满足开发者在不同场景下的需求。除了简单的代码生成和多语言支持外,Ling-Coder-Lite还擅长竞赛类和应用类高级代码生成、代码理解和输入输出推理、数据科学和SQL类数据分析,以及代码修复等复杂任务。

更多热门内容
天罡智算成功接入DeepSeek,推动AI算力服务升级(文末可下载DeepSeek报告礼包)
近日,天罡智算平台宣布成功接入国内领先大模型DeepSeek,为用户提供更强大的AI算力服务。DeepSeek系列大模型凭借其卓越的推理能力、低成本算力需求以及开源免费的显著优势,在全球引发关注,开启国产AI新时代。天罡智算此次本地化部署DeepSeek,大幅提升自然语言处理、

2025-04-02

薪智AI薪酬平台:人才大数据×智能体驱动的战略升级实践
伴随AI应用加速落地与持续深入,AI Agent作为人工智能技术的重要产品形态,被广泛应用于各类垂直场景、成为推动企业经营数智化转型的重要驱动力。以人力资源管理作为典型应用场景,AI Agent与薪酬的碰撞,成为企业人才战略中管理薪酬、提升人效、控制人力成本等多项目标

2025-04-02