ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

百度伐谋Agent 2.0再登MLE-Bench榜首 中国AI企业级应用实力彰显

时间:2026-04-10 20:00:38来源:天脉网编辑:快讯

在机器学习工程领域,百度智能云旗下的企业级算法自主优化智能体——百度伐谋Agent 2.0,再次以卓越表现登顶全球权威基准MLE-Bench,并刷新最优成绩。这一成果标志着中国AI技术在企业级算法工程领域实现新的突破,继去年10月首次登顶后,百度伐谋凭借持续优化的工程能力再次领跑全球。

MLE-Bench由OpenAI主导设立,被誉为检验智能体实战能力的“硬核考场”。该基准包含75个源自Kaggle竞赛的真实工程难题,覆盖模型训练、数据准备、实验运行等机器学习全流程,重点考察人工智能在复杂场景下的端到端自动化能力。百度伐谋Agent 2.0作为面向最优解的智能体,能够像顶尖算法工程师一样,从需求理解到方案输出实现全链路自动化,在具有明确评价标准的问题中高效寻找全局最优解。

最新评测显示,百度伐谋2.0在“高难度”任务中展现出显著优势,综合胜率超越搭载Claude-Opus-4.6等主流大模型的同类产品。这一成绩得益于其在演化策略、长程记忆机制和底层基础设施层面的全面升级:增强的演化策略支持多路径并行探索与动态回溯调整;长程记忆机制确保智能体在长链条任务中保持逻辑一致性;依托百度智能云全栈AI基础设施的优化,则大幅提升了算法迭代效率。

技术突破的同时,百度伐谋2.0显著降低了算法应用门槛。业务人员无需算法背景,仅需通过自然语言或数据文件提交需求,系统即可自动生成可解释、可交互的企业级解决方案。这一特性使其快速渗透至零售、金融、制造、能源、交通等国民经济核心领域,上线至今已服务数千家企业。

在汽车制造领域,阿尔特太乙与百度伐谋合作开发的御风智能预测系统,将单次风阻验证时间从10小时压缩至数分钟,整车研发周期平均缩短25%;金融风控场景中,中信百信银行引入该技术后实现7×24小时风险特征挖掘,效率提升100%,模型风险区分度提高2.41%;能源基建领域,中国能建广东院借助其解决海上风电电缆桥架布置难题,节省近一周工期与大量材料成本;交通信控方面,鄂尔多斯伊金霍洛旗部署百度智能云伐谋信控平台后,车均延误降低18%,高峰通行时间减少超50%。

科研场景同样见证了百度伐谋的价值。北京工业大学团队将其应用于中国空间站微型气相色谱柱设计实验,通过自动化寻优替代人工反复仿真,显著提升分离效率;天津大学团队利用该技术优化灾害预测模型,将原本需数周的科研探索压缩至6小时内完成。为进一步支持科研创新,百度智能云近期开源了Famou for Science项目,通过多智能体协同模式构建虚拟科研团队,涵盖实验管理、文档评审等角色,支持长线程科研任务的自动化推进与算法持续演化。

更多热门内容
字节AI时代再崛起:战略清醒、生态配合与组织力共筑新辉煌
紧接着在极短的时间内,字节把内部整个AI品牌体系:包括模型和产品全部统一到"豆包"这一个名字下,并将集团的资源集中到豆包上,阿里到2025年年底才完成了这种统一。 这就是字节能在AI时代再出一个豆包的原因—…

2026-05-21

谷歌I/O大会推出Gemini Omni:多模态输入输出,开启AI视频创作新纪元
在正式上线时,用户即可使用上述输入方式进行视频创作,而图像与文本的生成功能则将在后续版本中陆续推出。A:用户可以通过全新改版的Gemini应用体验Omni功能,部分功能还将在Google Flow和YouT…

2026-05-21

抖音“续火花”新玩法:赛博养娃成潮流,用户为火花“拼”出新花样
世超研究了一圈后,发现答案不在多闪里,而在抖音里的一个小功能——续火花。 你和好朋友、搭子或者 crush 在抖音里聊天 3天以上,就可以共同领养一个小火人。 在多闪 App 里,就能给小火人开通 AI …

2026-05-21

非遗声场溯源、院线技术入户,海信激光电视探索X1 Pro给出客厅影院新答案
5月20日,海信激光电视以“客厅影院·新答案”为主题,举办探索X1 Pro线上新品发布会。海信激光事业部总裁伍发明现场主讲,围绕中国家庭客厅的真实观影痛点,系统呈现新品在画质、声音、护眼、内容、安装五大维度的全面迭代。发布会现场首映了哈尼族多声部民歌纪录片《

2026-05-21