ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

百度文心大模型5.1发布:多榜单登顶,以6%成本实现同级领先性能

时间:2026-05-09 15:27:02来源:互联网编辑:快讯

百度近日宣布,其最新迭代的文心大模型5.1已正式上线。该版本在继承前代知识体系的基础上,通过架构创新实现预训练成本大幅压缩,总参数量缩减至前代的约三分之一,激活参数量减少约一半,仅需同类模型6%的预训练资源即可达到同级别领先性能。这一突破标志着大模型技术进入更高效、更经济的阶段。

在性能评估方面,文心5.1展现强劲竞争力。国际权威榜单Arena Search最新数据显示,该模型以1223分位列全球第四,在中国模型中稳居榜首。在智能体能力专项测试中,其τ³-bench和SpreadsheetBench-Verified成绩超越DeepSeek-V4-Pro,接近国际顶尖闭源模型水平。数学推理能力方面,在AIME26竞赛基准测试中取得99.6分,仅以微弱差距落后于Gemini 3.1 Pro。

知识应用与创作维度同样表现突出。GPQA和MMLU-Pro测试显示,其世界知识掌握程度与头部闭源模型相当;内部评估中创意写作能力已接近Gemini 3.1 Pro标准。深度搜索能力作为核心优势,在Search Arena排行榜的专项评分中持续保持领先地位。

技术实现层面,研发团队构建了"一次训练,处处部署"的弹性训练框架。该框架突破传统模型逐个训练的局限,通过动态采样机制同时优化不同规模子模型。具体实现三大创新:弹性深度机制使Transformer层数随机变化,促进深浅层特征共享;弹性专家容量通过动态调整MoE层参与路由的专家数量,提升计算资源利用率;弹性稀疏度采用可变Top-k路由,在推理效率与模型性能间取得动态平衡。

生态建设方面,文心5.1已启动多平台部署计划。即日起,全球领先的AI角色扮演平台ISEKAI ZERO、创意智能体平台Mulan AI、AI原生创意画布谛听幻流,以及AI短剧生成平台Storymaster等十余个创作平台将陆续接入该模型。开发者可通过千帆大模型平台将model_name切换至ernie-5.1调用API服务,普通用户登录文心一言官网即可体验最新交互能力。

更多热门内容
OpenAI Codex再升级!智能体插件上线,非程序员也能轻松驾驭AI编程
此外,OpenAI宣布其所有前沿模型和Codex现已支持在AWS平台一键部署,其为企业提供了两种使用方式:一是在AmazonBedrock上直接调用OpenAI模型,二是通过Codex on Amazon…

2026-06-03

阿里前副总裁张凯夫离职创业,携电商AI经验掘金“市场模拟器”赛道
张凯夫将自己多年在淘宝操盘万亿级市场的经验,转化为模型的市场直觉——这一差异化优势,是纯技术团队难以复制的。尽管赛道竞争激烈,但依托其深厚的电商与AI积淀,这一方向有望精准服务实体经济、电商平台及企业商业决策…

2026-06-03

谷歌新研究:大模型破除“幻觉”困境,元认知成开启可靠AI新钥匙
原因在于,忠实不确定性只需要AI的语言输出和自己的内部状态对应——这是一个闭环问题,信号就在模型内部,不依赖外部真相。 归根结底,这篇论文想传递的核心信息是:AI可以不全知全能,但它必须对自己知道什么、不知道…

2026-06-03

ChatGPT月活用户破10亿创纪录,人工智能领域竞争白热化且用户习惯生变
Sensor Tower 表示,ChatGPT 在推出约三年后,于 5 月达到 10 亿每月活跃用户人数,超过 GoogleMaps、TikTok、Instagram 及 YouTube 此前的增速纪录。…

2026-06-03

字节AI大牛顾全全告别Seed团队,或携AI4S成果开启创业新征程
今天是我在 ByteDance Seed 的最后一天。为了攻克现代 AI 中最棘手的难题之一 —— 可靠地训练和规模化扩展前沿级大语言模型—— 我加入了 LLM 预训练团队,并创立了 LLM 优化与规模化…

2026-06-03

阿里前副总裁张凯夫离职创业 聚焦构建面向市场世界模型 曾掌舵淘宝行业
6月3日,科创板日报获悉,阿里副总裁张凯夫已经离职创业,方向是构建面向市场的世界模型。他相信目前正是启程之时,并招募相关人才加入。2022年1月,任阿里巴巴M6(副总裁)。编辑:吴祈 【来源:科创板日报、公…

2026-06-03

OpenAI奥特曼:AI行业核心在技术研发与服务,上市非头部企业竞争关键
依托 Claude Code 相关产品市场热度,Anthropic 估值快速攀升至万亿级别,现已成长为 OpenAI 的核心竞品,与此同时OpenAI 自身也在稳步筹备年内 IPO 工作,马斯克旗下 Spa…

2026-06-03