ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

蚂蚁发布万亿参数Ling-1T模型,多项测试领先,FP8训练及创新方法成亮点

时间:2025-10-09 16:10:29来源:快讯编辑:快讯

蚂蚁百灵大模型家族迎来重要成员——Ling-1T。这款拥有万亿参数的通用语言模型由蚂蚁集团自主研发,作为Ling 2.0系列的首款旗舰产品,其规模与性能均创下团队历史新高。该模型在复杂推理任务中展现出卓越能力,在有限输出Token条件下,于多项基准测试中刷新最佳成绩,尤其在高效思考与精确推理的平衡方面表现突出。

在竞赛数学领域,Ling-1T的表现尤为亮眼。以美国数学邀请赛25题(AIME 25)为例,该模型仅消耗平均4000余Token即达到70.42%的准确率,超越同期测试的Gemini-2.5-Pro(消耗5000+Token,准确率70.10%)。这种以更少资源实现更高精度的特性,使其在推理效率与准确率的综合评估中占据优势,相关成果已推动该领域帕累托前沿的拓展。

技术架构方面,Ling-1T延续了Ling 2.0的核心设计,依托超过20万亿Token的高质量语料库完成预训练,支持最长128K的上下文窗口。通过"中训练+后训练"的演进式思维链(Evo-CoT)技术,模型在复杂逻辑推导和精准答案生成方面获得显著提升。特别值得关注的是,该模型采用FP8混合精度训练方案,成为当前已知规模最大的FP8基座模型,这项创新使显存占用降低、并行策略更灵活,并实现15%以上的端到端训练加速。

在强化学习阶段,研发团队提出LPO(Linguistics-Unit Policy Optimization)策略优化算法,以"句子"为最小优化单元。这种设计既避免了词元级处理的碎片化问题,又克服了序列级优化的笼统性,使奖励信号与模型输出在语义层面实现精准匹配。同时,团队构建的"语法-功能-美学"混合奖励机制,在确保代码正确性的基础上,显著提升了模型对视觉美学的理解能力。

在前端开发能力评估中,Ling-1T于ArtifactsBench基准测试取得59.31分,虽略低于Gemini-2.5-Pro-lowthink的60.28分,但在开源模型中稳居首位。该模型在代码生成、软件开发、专业数学等领域同样表现优异,多项指标刷新开源社区纪录。目前,开发者可通过Hugging Face平台及蚂蚁百宝箱等渠道体验Ling-1T的完整功能。

据悉,蚂蚁百灵团队还在同步推进深度思考大模型Ring-1T的研发,其preview版本已于9月30日开源。这款聚焦复杂推理的新模型,将与Ling-1T形成能力互补,共同构建更完整的AI技术矩阵。

更多热门内容
iPhone 17e或2026年亮相,折叠iPhone将至,三星独家供应OLED面板
相关的消息显示,该系列手机将以预算为导向,并每年进行硬件升级,类似于标准版和Pro版iPhone的更新策略。 另一份消息则显示,iPhone17e将配备iPhone 16同款的6.1英寸的显示屏,即应用打…

2025-10-09

荣耀Magic8系列10月15日登场,MagicOS 10同步亮相,配置与功能亮点多
2025年10月9日,荣耀手机官微发布消息称,荣耀Magic8系列暨MagicOS 10发布会定档10月15日。 MagicOS10基于Android 16深度定制。AI功能上,YOYO建议更智能,YOYO…

2025-10-09

荣耀Magic8系列10月15日登场:AI自进化赋能,开启智慧生活新篇章
其中“AI自进化”与“2亿超夜神”成为业界及用户的两大关注焦点。 为进一步释放AI交互能力,更便捷、高效地开启智能生活,荣耀Magic8系列在机身侧边新增了专属AI物理按键,可以一键触发AI相关应用,为用户提…

2025-10-09

智元机器人携手龙旗科技:签下数亿订单,共拓工业具身智能新蓝海
龙旗科技董事长杜军红表示,依托智元机器人的优势,龙旗不仅能深化AI与智能硬件融合创新、强化AI核心产品矩阵,还能加快其“1+2+X”产品版图布局,同时为客户提供更丰富的产品方案。智元机器人董事长兼CEO邓泰…

2025-10-09

OPPO Find X8 Ultra与vivo X200 Ultra人像对决:风格各异,谁更合你心意?
在85mm焦段拍摄的这一组照片中,两款旗舰手机的样张除了前面说的色彩风格之外,vivo在1/20s的快门下仍然保持了很好的出片能力。 另一组是我们在远处高机位采用135mm焦段拍摄的样张,除了色彩上的差异外,…

2025-10-09

英伟达与英特尔“牵手”:黄仁勋谈从竞争到战略协作的共赢之路
【环球网科技综合报道】10月9日消息,据Benzinga报道,英伟达CEO黄仁勋近日在一档电视访谈节目中,回顾了英伟达与英特尔的竞争历程,并重点谈及双方如今的战略合作关系。 黄仁勋在访谈中首先提及两家企业漫长…

2025-10-09

台积电2nm代工价格揭晓:涨幅温和,约10%至20%间
至于2nm代工报价则是一片晶圆的代工价约3万元,相较3nm单片晶圆平均价2.5万美元到2.7万美元,价格涨幅大概在10%到20%之间,并没有此前市场盛传的涨价50%那么高。 此外,由于台积电的3nm、4nm…

2025-10-09

四年深度共创结硕果,realme真我携手理光映像开启影像合作新篇
从 2021 年的重庆街拍开始,双方团队就一直在深入地沟通合作,我们团队前后组织了数十轮的讨论共创会,多次飞往理光总部,进行工厂互访;我们甚至派驻了工程师团队到理光,和他们的光学、色彩工程师一起工作,就是为了…

2025-10-09

小米17系列开售5天销量破百万,周度登顶,高端市场与苹果正面交锋
2025年第39周(9月22日至9月28日),小米凭借小米17系列的首销爆发,以22.08%的市场份额成为中国智能手机市场的周度冠军,短暂超越了苹果。 据悉,在开售仅5分钟后,小米公关部总经理王化就在微博宣布…

2025-10-09

OPPO Watch S智能手表外观亮相,10月16日全球首发,或成轻薄智能表新标杆
IT之家 10 月 9 日消息,今天下午,OPPO 揭晓了 Watch S 智能手表的外观,这款手表号称“轻薄表皇”,将于 10 月 16 日19 时全球首发。Mini 版本于同年 4 月发布,主打轻薄设计…

2025-10-09