ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

百度2025十大科技前沿发明亮相 覆盖AI多领域引领行业新方向

时间:2025-11-05 00:11:35来源:快讯编辑:快讯

近日,北京迎来了一场聚焦人工智能前沿成果的盛会——“2025百度十大科技前沿发明”发布会。此次发布的十项发明覆盖大模型、深度学习框架、AI算力、智能体、AI搜索、数字人、无人驾驶等核心领域,不仅展现了百度在AI底层技术的突破性进展,更勾勒出AI应用从技术积累向场景落地的关键路径,为行业构建起覆盖“算力-框架-模型-场景”的全栈技术图谱。

在基础模型层面,新一代文心大模型的核心技术“自回归统一建模的原生多模态大模型”成为焦点。该技术首次实现语言、图像、视频、音频的统一建模框架,支持任意模态的理解与生成,并构建了面向大模型的奖励系统。通过多环境多任务场景的强化学习,新一代模型在各模态任务上较上一代显著提升,并发能力增强且响应时间缩短,为复杂场景应用提供了技术支撑。例如,在医疗影像分析中,模型可同步处理CT影像与患者语音描述,生成结构化诊断报告;在智能教育场景中,能根据学生语音提问自动生成图文并茂的解答内容。

针对大模型训练的稳定性难题,“大模型训练全流程高效容错技术”提出了创新解决方案。通过构建软硬件故障自动召回定位恢复体系,该技术攻克了集群训练中故障定位与召回恢复两大核心挑战。其零损失训练快照机制可在故障发生时瞬间保存训练状态,结合全场景故障定位方法,使万卡集群任务的训练有效率超过98%,资源利用效率显著提升。目前,该技术已应用于文心大模型系列训练,支撑起每日数万次的高强度计算需求。

在数字人领域,“剧本驱动的高说服力数字人技术”推动了行业进入普惠化阶段。该技术整合可控视频生成、超拟真唇形驱动、剧本智能创作与AI大脑自主决策四大能力,突破了大表情/大动作生成、音容话一致、人-物-场交互等业界难题。以罗永浩数字人直播间为例,双数字人互动模式实现单场GMV超5500万元,后验数据全面超越真人主播。这项技术不仅降低了数字人制作成本,更通过AI大脑赋予其自主决策能力,可灵活调度助播、场控等角色,形成“一人即团队”的营销生态。

搜索场景的革新体现在“基于多智能体协同的AI搜索引擎”上。该技术以Master-Planner–Executor-Generator四层智能体体系为底座,模拟人类信息处理的“感知-规划-执行-生成”全流程。在百度文心助手中,这一技术支撑起复杂问题拆解、富媒体呈现、个性化满足等核心能力,使日活跃用户与用户留存率显著提升。例如,当用户搜索“北京周末亲子游”时,搜索引擎可自动规划包含景点、交通、餐饮的完整方案,并生成图文并茂的行程手册。

视频生成领域,“蒸汽机(文心专精)音视频一体化生成大模型技术”开启了双向共创新阶段。作为全球首个中文音视频一体化生成模型,它支持分钟级多人有声音视频生成与交互,通过LatentMultiModalPlanner技术重构生成逻辑,实现视频全流程有声一体化。在影视创作场景中,该技术可将制作成本降低70%,同时提供大师级运镜控制。对外赋能方面,其长视频实时交互生成能力已应用于商业内容生产、搜索妙笔等业务,推动百度AI视频生态繁荣。

在自动驾驶领域,“兼容端到端轨迹方案的横纵联合控制技术”实现了技术跃迁。基于车辆横纵耦合动力学,该技术设计的线性时变模型预测控制器,使横向晃动幅度优化70%,弯道横向抽动问题完全消除。目前,搭载该技术的萝卜快跑自动驾驶车辆已驶入香港、迪拜等16座城市,累计提供超1400万次服务,安全行驶里程突破2亿公里,其拟人化控制水平接近经验丰富的驾驶员。

其他技术同样亮点纷呈:“从芯片到集群的跨层级训推一体AI基建系统性技术”构建起完备的AI基础设施体系,使XPULink带宽提升8倍,网络时延压至4微秒;“信息流端到端内容理解与序列生成技术”突破推荐系统局限,实现多模态内容理解与个性化生成;“飞桨科学计算高效求解技术”将微分方程求解速度提升2-4个数量级,加速科学计算领域创新;“基于智能体的自进化应用生成技术”则通过三重自进化学习架构,使应用开发成本从传统模式的大约4人周、2万元缩减到小于1小时、低于50元,纯无代码生成应用已达38万。

更多热门内容
iOS26.1正式版来袭!iPhone17系列及iPhone Air用户升级后续航显著提升
1月4日凌晨,苹果向 iPhone 和 iPad 用户推送了 iOS / iPadOS 26.1 更新(内部版本号:23B85),这是自 9月发布 iOS 26 以来的首个重大更新版本,而且升级很长心,真的…

2025-11-05

告别PS繁琐操作!这款AI工具图层可编辑、交互生成超便捷
系统自动识别了图里的多个主体:人物、海滩、天空、字幕,甚至连它从网上搜来的两张原始图也能一起编辑。 有意思的是,之后我们又输入了两个图像提示,但没有再上传参考图,Reve居然还是能延续我们上传的“奇奇”形象进…

2025-11-05

苹果库乐队2.3.18版本更新:图标大改,写实吉他亮相,多款应用图标同步优化
11 月 4 日消息,科技媒体 Appleinsider 昨日(11 月 3日)发布博文,报道称苹果公司更新其库乐队(GarageBand)应用,在最新 2.3.18 版本中,主要重新设计了应用图标,融合了…

2025-11-05

安兔兔2025年10月安卓次旗舰性能榜:天玑芯片包揽前十,天玑8400系列领跑
快科技11月4日消息,安兔兔2025年10月安卓次旗舰手机性能TOP10榜单正式揭晓,联发科天玑芯片展现绝对统治力,榜单所有机型均搭载天玑系列处理器。realmeNeo7 SE搭载天玑 8400-Ultra…

2025-11-05

传苹果首款书本式折叠屏iPhone明年登场 屏幕技术升级定价或对标华为
据此前爆料,该手机可能取名为iPhone Fold,采用类似三星Z Fold的书本式结构,横向展开后屏幕尺寸接近iPad mini。 据媒体报道,苹果首款折叠屏iPhone的屏幕将全部由三星显示供应,或将采用…

2025-11-05

荣耀500系列新机线稿亮相:横向跑道DECO搭配大R角直屏,配置全面升级
11月4日消息,博主@数码闲聊站曝光了荣耀500系列新机的线稿,新机采用全新横向跑道DECO和大R角直屏设计,设计朝苹果看齐。总的来看,荣耀500系列既保留了前代特色,又在性能和影像上实现了全面升级,有望成为…

2025-11-05

苹果iOS 26.1正式版来袭:液态玻璃可调透明度 闹钟滑动关闭新体验
iOS 26.1默认采用高透明效果,但是用户可在设置中切换“色调”模式,后者可降低透明度效果,提升可读性。 -新增色调切换开关,可在默认透明外观与新“半透明磨砂”外观间进行选择,用于提升App、锁屏及通知界…

2025-11-04

家庭与办公网络需求攀升,多款性能卓越路由器测评与选购指南
综合来说,路由器的挑选要依据实际需求来进行:要是追求最新的技术和全场景的管理,则华硕RT - BE86U在端口配置,安全功能以及软件生态方面有着显著优势;要是侧重于特定功能比如多频段支持或者性价比的话,TP…

2025-11-04

中国电信首发北斗语音消息 深耕产业链共绘“北斗+”产业新图景
对于中国电信而言,北斗语音消息的成功标志着通信技术领域的重要突破,其实现了“人工智能+北斗”技术与大众日常通信需求的深度融合,为北斗应用注入了强劲动能。其中,天通无人机电子信标产品整合物联网、5G、北斗定位及…

2025-11-04

双万兆+5G-A筑牢通信基石,“智云上海”助力进博会畅行无忧
在进博会指挥中心设置的“智云上海”展示窗口中,“AI STORE”成为亮点,通过整合公共算力与主流模型资源,为企业与公众提供从算力调度、模型部署到智能体应用的一站式服务,集中体现了电信在算力与智能应用方面的创…

2025-11-04