北京举办“2025百度十大科技前沿发明”发布会,展示AI领域突破性成果。此次发布的十大发明涵盖大模型、深度学习框架、AI算力、智能体、AI搜索、数字人、无人驾驶等核心方向,构建起覆盖“算力-框架-模型-场景”的全栈技术体系,为AI应用从实验室走向规模化落地提供关键支撑。
在基础架构层面,百度推出“从芯片到集群的跨层级训推一体AI基建系统性技术”,通过UltraServer柜级超节点架构、XPULink高速通信协议及PD分离计算模式,实现算力8倍带宽提升与MoE模型5-10倍性能跃升。存储系统采用自适应元数据架构,突破千亿级文件管理瓶颈,配合弹性eRDMA网络技术,将集群时延压缩至4微秒,支撑5000节点分钟级自愈能力。该技术已应用于文心大模型训练,使万卡集群任务有效率突破98%,达到国际领先水平。
多模态技术实现重大突破。新一代“自回归统一建模的原生多模态大模型”构建业界首个语言、图像、视频、音频统一框架,支持任意模态混合理解与生成。配套研发的奖励系统通过多环境强化学习,使模型并发能力提升40%,响应延迟降低35%。在应用端,“剧本驱动的高说服力数字人技术”集成可控视频生成、超拟真唇形驱动等四大核心能力,打造的罗永浩双数字人直播间单场GMV超5500万元,验证技术商业化潜力。
搜索领域,“基于多智能体协同的AI搜索引擎”采用Master-Planner-Executor-Generator四层架构,模拟人类信息处理全流程。该技术支撑文心助手实现复杂问题拆解、富媒体呈现等能力,使日活用户增长27%,用户留存率提升19%。同时开放赋能合作伙伴,推动搜索行业进入智能体协同时代。
在内容生成领域,“蒸汽机音视频一体化生成大模型”首创中文场景有声一体化训练技术,支持分钟级多人互动视频生成。通过LatentMultiModalPlanner重构生成逻辑,将影视制作成本降低70%,已应用于商业内容生产、搜索妙笔等业务,并对外输出长视频实时交互能力,引领行业进入“双向共创”阶段。
自动驾驶技术取得实质性进展。“兼容端到端轨迹方案的横纵联合控制技术”通过线性时变模型预测控制,使低速横向晃动优化70%,弯道抽动问题完全消除。该技术支撑萝卜快跑在香港、迪拜等16城落地,累计服务超1400万次,安全行驶里程突破2亿公里,为全球化布局奠定技术基础。
开发工具链方面,“基于智能体的自进化应用生成技术”构建需求-代码-创意三重学习架构,实现纯无代码应用生成38万个,开发成本从2万元降至50元以下。配合“飞桨科学计算高效求解技术”在微分方程领域的突破,已助力中科院、中车集团等近20家机构完成空气动力学仿真等创新应用,推动AI for Science范式转型。