ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

华为小艺AI竞赛Agent首战国际数学奥林匹克大赛(IMO)荣获佳绩!

时间:2025-07-28 11:15:10来源:互联网编辑:茹茹

在2025年国际数学奥林匹克竞赛(IMO)官方的特别邀请下,小艺AI竞赛Agent亮相本届全球顶尖的数学赛事。经过三天的激烈角逐,小艺AI竞赛Agent成功攻克6道难题中的5道,以34分的优异成绩摘得银牌,距离金牌分数线(35分)仅1分之差。这一历史性的突破,标志着华为AI的逻辑推理能力达到了一个新的高度。

IMO主席Gregor Dolinar教授对华为AI的表现给予了高度评价:“华为AI提交的答卷获得了34分(满分42分),这是一个了不起的成就。(The Huawei AI scripts received a grade of 34 out of 42, which is a remarkable result.)”

不止于答题:小艺AI竞赛Agent展现专家级解题艺术

与传统模型追求解题套路不同,小艺AI竞赛Agent在解题过程中展现了接近顶尖解题方式的创造力和严密性:

专家级推理能力:小艺AI竞赛Agent完美攻克第1至第4题,均获满分(7分)。其论证过程严谨、逻辑自洽、可读性强,此外在第3题中还灵活运用了“升幂定理”等技巧,展现了深厚的数学知识储备。值得说明的是第5题,评审组确认,尽管Agent因对平局情况的表述存在细微瑕疵被扣1分,但其核心思维过程已完整包含了对该情况的严谨证明。这表明,它实际上已具备了解答该题所需的全部数学能力。

闪耀的解题灵感在第2题的证明中,小艺AI竞赛Agent精准预测并添加了唯一一个辅助点,便完成了整个复杂证明的生成。其解法之高效、思路之凝练,显著优于已知的公开解法。

接近完美的思考深度:第1题的解答思路流程完整,清晰简洁,对于n=3的情况讨论充分,归纳过程严谨;同时在第4题的解答中对所有情况讨论完备,证明的结构层级分明,易于理解。

> 对IMO竞赛感兴趣的开发者,可以前往GitHub了解小艺AI竞赛Agent完整的赛题解答,链接:https://github.com/Huawei-xiaoyi/IMO2025-solutions

技术揭秘:驱动巅峰表现的“双脑”协同架构

小艺AI竞赛Agent的卓越表现,源于其创新的“自然语言大模型 + 形式化证明”协同架构。这套系统如同一个拥有“左右脑”的数字大脑,将人类的直觉创造与机

器的严谨验证无缝融合。

1、思维风暴与“AI同行评审”:孕育创造性解法

面对难题,小艺AI竞赛Agent首先通过并行采样生成海量、多样化的解题思路,如同进行一场“思维风暴”。随后,启动独特的“AI同行评审”机制,让不同的AI模型互相审阅、辩论、评分,从而筛选出最优的思路路径。这一过程还会融合形式化证明的反馈,指导AI模型进行多轮自我修复与迭代优化,极大提升了模型攻克精英级难题的创造力。

2迭代式多层级证明:构建严密的逻辑闭环

为克服高复杂度数学证明严谨性的挑战,华为小艺团队设计了迭代式多层级并行证明系统。该系统首先将复杂的证明目标分解为树状的多层级子问题,然后由形式化证明模型自下而上地对每个子节点进行大规模并行验证。一旦某个环节证明失败,具备反思和自我修正能力的模型将立刻启动修复流程,直至整个逻辑链条完美闭环。

里程碑与新起点:共探AI与教育的未来

此次赛事的成果,不仅是华为AI发展的重要里程碑,更充分地证明了基于大语言模型(LLM)的多Agent协同系统在解决高阶数学问题上的强大潜力。

与此同时华为小艺团队也意识到,当前系统在面对极高复杂度的数学问题时(如本届IMO第6题)仍有局限,未来将会继续提升小艺的抽象推理与问题建模能力,持续向高阶数学推理探索。

据悉,小艺AI竞赛Agent的核心能力,未来将逐步赋能于小艺教育Agent。华为小艺团队或将以白名单机制,优先向数学及AI领域的专业研究者开放,旨在共同推动智能解题方法论的创新,让顶级的思维能力普惠每一位学习者。

更多热门内容
九章智算云(Alaya NeW Cloud)推出158元起高校普惠算力产品Aladdin,引爆AI4R科研市场
在2025世界人工智能大会期间,九章智算云(Alaya NeW Cloud)正式发布了GPU算力服务平台Aladdin。数据显示,过去三个月,Aladdin平台的用户已覆盖清华大学、北京大学、复旦大学、哈尔滨工业大学、上海交通大学等全国多数“双一流”高校的AI研究团队。平台用户中还包含诸多

2025-07-28

IT之家发布5月鸿蒙生态“星”榜单 人保app成唯一上榜保险类应用
近期,科技媒体IT之家发布了鸿蒙生态5月“星”榜单,新浪微博、QQ、飞书、京东等多款鸿蒙应用入选榜单。其中,鸿蒙版微博在本月初上线了AI智搜功能,基于DeepSeek-R1的深度思考能力,方便大家更加全面地了解“新鲜事”。鸿蒙版小红书,新增直播支持上下滑动切换,此外还优化首

2025-07-28

贾跃亭:FX Super One加速产品交付、认证测试及试制生产,8月参展圆石滩
7月28日,Faraday Future(FF)创始人、联席CEO贾跃亭在投资者周报中透露,FX Super One在717首次产品发布当天累计收到了超过10000的付费预订单。公司,正在加速产品交付、系列认证测试及试制生产,8月参展圆石滩豪车展。贾跃亭表示,Super One五大价值突破点,奠定了它在

2025-07-28

Deamoy 开启邀请制内测,一句话生成全栈应用
7月23日,人工智能领域的创新团队 Deamoy 宣布,其面向全栈应用构建的智能体画布(Agentic Canvas )Deamoy.ai 正式开启邀请制内测。该平台深度融合前沿的大语言模型技术与可视化编辑能力,旨在重塑 Web 和 App 的开发范式,让用户仅需一句话,即可像播放幻灯片一样实时生

2025-07-28

WAIC 2025 | 北电数智发布新天·智能体平台,加速“更懂行业”的智能体落地
当前,人工智能发展正在从Generative AI向Agentic AI阶段演进。凭借“感知、理解、推理、行动”一体化的全新能力,智能体带来了更高效、更智能的应用模式。各行各业普遍希望通过智能体技术,推动业务流程自动化、决策智能化和运营效率跃升。在2025世界人工智能大会(WAI

2025-07-28

智联招聘亮相2025世界人工智能大会 揭秘AI Agent如何重塑招聘行业新范式
7月27日,全球人工智能领域顶级盛会“2025世界人工智能大会(WAIC)”在上海世博中心盛大开幕。智联招聘作为中国领先的人力资源服务企业,受邀出席阿里云主办的《开源·开放:AI Agent应用生态》主题论坛,分享其在AI Agent技术落地招聘场景的前沿实践。智联招聘CTO王昊发

2025-07-27

AI新势力!中国移动发布灵犀智能体2.0,让智能生活“说”来就来
7月27日,在2025世界人工智能大会期间,中国移动在上海举办了灵犀智能体2.0发布会,正式发布新一代灵犀智能体2.0。中国移动副总经理张冬出席活动。张冬表示,当前移动通信与人工智能的深度融合正深刻改变人类社会生产生活治理范式,重塑国家竞争力格局。作为央企“AI国

2025-07-27

WAIC2025现场直击:鲍捷教授倡议推动全球AI公平,从“感知”开始
7月27日,在2025世界人工智能大会(WAIC)的新兴经济体与发展中国家弥合人工智能合作鸿沟国际合作论坛上,芯视界科技创始人兼首席科学家、全球AI感知数智中心(筹)执行主任鲍捷,与澳门转化医学中心主任何耀、西班牙马德里理工大学中国代表Ferre Xavier、斯科尔科沃科学

2025-07-27

加速智能体创新 腾讯云发起Agent应用创新挑战赛
7月27日,在2025世界人工智能大会(WAIC)腾讯论坛上, 腾讯云正式宣布启动首届“腾讯云黑客松Agent应用创新挑战赛” 。本次大赛由腾讯云发起,聚焦AI智能体开发领域,面向企业开发者、高校团队及个人开发者开放报名,致力于推动AI智能体技术从“可用”向“好用”进化。(

2025-07-27

2025WAIC丨腾讯云副总裁吴运声:把AI变成全新生产力
“腾讯将通过扎实的底层模型、好用的平台工具、广泛的应用生态,让AI建得起、跑得稳、用得好,让每个人、每个企业,都能用上真正好用的AI。”7月27日,在2025世界人工智能大会腾讯论坛上,腾讯云副总裁、腾讯云智能负责人、腾讯优图实验室负责人吴运声表示。腾讯云副总

2025-07-27