百度文心X1 Turbo登顶国内推理能力首位，吴甜揭秘技术创新亮点-人工智能-ITBear科技资讯

近期，中国信息通信研究院公布了一项关于大模型推理能力的评估结果，百度文心X1 Turbo在众多竞争者中脱颖而出，凭借卓越的表现赢得了最高评级“4+级”。在此次评估的24项能力中，文心X1 Turbo取得了16项5分、7项4分和1项3分的优异成绩，成为首个通过该测评的大模型。特别是在逻辑推理、代码推理以及推理效果优化等方面，文心X1 Turbo更是获得了满分评价。

那么，是什么让百度文心X1 Turbo能够在这次评估中大放异彩呢？在百度AI Day上，百度集团副总裁吴甜为我们揭开了谜底。

吴甜详细介绍了文心大模型最新版本的技术创新。她提到，文心4.5 Turbo是文心4.5的升级版，不仅在效果上更胜一筹，成本也更为低廉。基于文心4.5 Turbo，文心X1升级为X1 Turbo，性能大幅提升，同时拥有了更先进的思维链，使得问答、创作、逻辑推理、工具调用和多模态能力得到了进一步增强。

文心4.5及4.5 Turbo在多模态学习方面取得了显著进展，实现了文本、图像和视频的混合训练。针对模态数据间的差异，百度通过一系列创新技术，如多模态异构专家建模、自适应分辨率视觉编码等，使得跨模态学习效率和多模态融合效果大幅提升，学习效率提高近两倍，多模态理解效果提升超过30%。

在后训练阶段，百度研发了自反馈增强的技术框架，通过“训练-生成-反馈-增强”的闭环迭代，让大模型具备了自我优化的能力。这一技术不仅解决了数据生产难度大、成本高的问题，还显著降低了模型幻觉，提升了模型理解和处理复杂任务的能力。

在训练过程中，百度融合了偏好学习的强化学习技术，通过统一的奖励机制，提高了对结果质量判别的准确率。这一技术不仅提升了数据利用效率和训练稳定性，还增强了模型对高质量结果的感知能力，使模型的理解、生成、逻辑和记忆等能力得到了全面提升。

在深度思考方面，百度突破了传统思维链优化的范式，构建了融合思考和行动的复合思维链。这一创新使得模型在解决问题时思路更加清晰、逻辑更加严密，表达能力也得到了显著提升。同时，结合多元统一的奖励机制，实现了思考和行动链的端到端优化，大幅提升了模型的跨领域问题解决能力。

在数据建设方面，百度打造了“数据挖掘与合成-数据分析与评估-模型能力反馈”的闭环流程，为模型训练提供了源源不断的高质量数据。这一流程不仅具备良好的可扩展性，还能够轻松迁移到全新的数据类型，实现高效的数据生产。

吴甜还指出，随着大模型能力的拓展和效率的提升，百度正在探索更多具有前瞻性和想象力的创新应用。例如，在数字人领域，百度研制了“剧本”驱动多模协同的超拟真数字人技术，实现了语言、声音、形象的协调一致。目前，这项技术已经支持了超过10万数字人主播，直播转化率高达31%，大大降低了直播开播成本。在代码场景上，百度基于文心大模型的语言和代码能力，研制了代码智能体和智能代码助手——文心快码。目前，文心快码已经向全社会开放，累计服务了760万开发者。

吴甜还强调了飞桨文心联合优化的重要性。通过训练和推理的技术创新，文心4.5 Turbo的训练吞吐达到了文心4.5的5.4倍，推理吞吐更是达到了8倍。目前，飞桨文心已经吸引了超过2185万的开发者，服务了67万家企业，创建了110万个模型。

基于飞桨深度学习平台和文心大模型，百度在全国范围内落地了多个产业赋能中心、数据生态中心和教育创新中心。这些中心以科技+人才+创新的模式，打造区域人工智能公共技术服务平台，汇聚行业高价值数据集、培养新型复合型人才、赋能本地AI产品研发，为区域产业的智能化升级注入了新的活力。