ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

百度文心X1 Turbo登顶国内推理能力首位,吴甜揭秘技术创新亮点

时间:2025-05-20 19:23:14来源:ITBEAR编辑:快讯团队

近期,中国信息通信研究院公布了一项关于大模型推理能力的评估结果,百度文心X1 Turbo在众多竞争者中脱颖而出,凭借卓越的表现赢得了最高评级“4+级”。在此次评估的24项能力中,文心X1 Turbo取得了16项5分、7项4分和1项3分的优异成绩,成为首个通过该测评的大模型。特别是在逻辑推理、代码推理以及推理效果优化等方面,文心X1 Turbo更是获得了满分评价。

那么,是什么让百度文心X1 Turbo能够在这次评估中大放异彩呢?在百度AI Day上,百度集团副总裁吴甜为我们揭开了谜底。

吴甜详细介绍了文心大模型最新版本的技术创新。她提到,文心4.5 Turbo是文心4.5的升级版,不仅在效果上更胜一筹,成本也更为低廉。基于文心4.5 Turbo,文心X1升级为X1 Turbo,性能大幅提升,同时拥有了更先进的思维链,使得问答、创作、逻辑推理、工具调用和多模态能力得到了进一步增强。

文心4.5及4.5 Turbo在多模态学习方面取得了显著进展,实现了文本、图像和视频的混合训练。针对模态数据间的差异,百度通过一系列创新技术,如多模态异构专家建模、自适应分辨率视觉编码等,使得跨模态学习效率和多模态融合效果大幅提升,学习效率提高近两倍,多模态理解效果提升超过30%。

在后训练阶段,百度研发了自反馈增强的技术框架,通过“训练-生成-反馈-增强”的闭环迭代,让大模型具备了自我优化的能力。这一技术不仅解决了数据生产难度大、成本高的问题,还显著降低了模型幻觉,提升了模型理解和处理复杂任务的能力。

在训练过程中,百度融合了偏好学习的强化学习技术,通过统一的奖励机制,提高了对结果质量判别的准确率。这一技术不仅提升了数据利用效率和训练稳定性,还增强了模型对高质量结果的感知能力,使模型的理解、生成、逻辑和记忆等能力得到了全面提升。

在深度思考方面,百度突破了传统思维链优化的范式,构建了融合思考和行动的复合思维链。这一创新使得模型在解决问题时思路更加清晰、逻辑更加严密,表达能力也得到了显著提升。同时,结合多元统一的奖励机制,实现了思考和行动链的端到端优化,大幅提升了模型的跨领域问题解决能力。

在数据建设方面,百度打造了“数据挖掘与合成-数据分析与评估-模型能力反馈”的闭环流程,为模型训练提供了源源不断的高质量数据。这一流程不仅具备良好的可扩展性,还能够轻松迁移到全新的数据类型,实现高效的数据生产。

吴甜还指出,随着大模型能力的拓展和效率的提升,百度正在探索更多具有前瞻性和想象力的创新应用。例如,在数字人领域,百度研制了“剧本”驱动多模协同的超拟真数字人技术,实现了语言、声音、形象的协调一致。目前,这项技术已经支持了超过10万数字人主播,直播转化率高达31%,大大降低了直播开播成本。在代码场景上,百度基于文心大模型的语言和代码能力,研制了代码智能体和智能代码助手——文心快码。目前,文心快码已经向全社会开放,累计服务了760万开发者。

吴甜还强调了飞桨文心联合优化的重要性。通过训练和推理的技术创新,文心4.5 Turbo的训练吞吐达到了文心4.5的5.4倍,推理吞吐更是达到了8倍。目前,飞桨文心已经吸引了超过2185万的开发者,服务了67万家企业,创建了110万个模型。

基于飞桨深度学习平台和文心大模型,百度在全国范围内落地了多个产业赋能中心、数据生态中心和教育创新中心。这些中心以科技+人才+创新的模式,打造区域人工智能公共技术服务平台,汇聚行业高价值数据集、培养新型复合型人才、赋能本地AI产品研发,为区域产业的智能化升级注入了新的活力。

更多热门内容