ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

百度搜索文心助手焕新:8大模态创作矩阵+实时数字人开启AI交互新篇

时间:2025-10-17 09:00:35来源:快讯编辑:快讯

百度搜索近日宣布,旗下文心助手AIGC创作能力迎来重大升级,推出涵盖AI图片、视频、音乐、播客等八大模态的创作矩阵,并同步发布行业首个开放式实时互动数字人智能体。此次升级标志着搜索引擎从传统信息检索工具向“全能创作与服务平台”的深度转型,同时突破了多项技术瓶颈,为用户提供更高效的创作与任务解决方案。

升级后的文心助手构建了全栈式创作能力,尤其在视频生成领域实现核心突破。依托百度蒸汽机(文心专精)模型的技术迭代,传统AI视频10秒左右的时长限制被彻底打破,用户输入一段文字即可生成3分钟的长视频故事,涵盖情节设计、角色建模、镜头运镜、配乐合成等全流程,且生成速度超越国内主流同类模型。平台还集成了“一句话写歌”“MV制作”“名场面模仿秀”等特色功能,搭配超30种特效模板,形成覆盖静态图像处理、动态视频制作、音频创作的完整生态链。

在创作场景的延伸上,文心助手已支持用户日均生成千万量级的AIGC内容,印证了多模态创作工具的规模化应用价值。据百度搜索相关负责人透露,后续即将上线的音乐数字人分身功能,将进一步实现“创作-演绎”的全链路AI赋能,为用户提供更沉浸式的创作体验。

除内容创作外,文心助手在任务解决能力上也实现了关键升级。通过构建多工具调用引擎,用户可一键触发跨领域服务,覆盖生活规划、健康咨询、教育辅导、职场办公等核心场景。例如,家长查询“小学生科学实验方案”时,系统可自动整合实验步骤文本、器材清单图片、操作演示短视频,并生成可打印的任务卡,无需用户多次切换工具。这种“需求-解决方案”的直达模式,体现了文心大模型对用户意图的深度理解与资源调度能力。

同日发布的开放式实时互动数字人智能体,成为本次升级的另一大亮点。该技术基于文心大模型4.5构建,融合NOVA数字人技术的核心优势,提供超拟真交互体验:通过10分钟真人样本数据即可复刻声音特征、动作习惯与微表情,口型准确率与表情自然度达到行业领先水平;采用云渲染与端渲染双引擎适配,兼容多终端场景,实时对话延迟控制在百毫秒以内;目前已接入法律、情感、旅游等领域的专家数字分身,用户可直接就专业问题展开深度对话,未来还将开放第三方开发者平台。

更多热门内容
百度搜索文心助手焕新:8模态创作矩阵+实时数字人开启AI交互新篇章
百度搜索正式宣布文心助手AIGC创作能力全面升级,推出涵盖AI图片、AI视频、AI音乐、AI播客等8种模态的创作矩阵,并同步发布行业首个开放式实时互动数字人智能体。 升级后的文心助手构建起全栈式创作能力,其…

2025-10-17

沪疆携手共筑科技梦:新疆学子闵行研学,AI与非遗碰撞绽放新光彩
9月25日,75名来自喀什地区泽普县的中学生走进闵职院,参与以“AI助研,闵泽同行”为主题的“祖国情·中华行”青少年“手拉手”研学活动。 活动当天,上海援疆泽普分指教育事业组组长、泽普县教育局副局长陈伟峰与…

2025-10-17

荣耀Magic8系列发布:自进化AI智能体赋能,手机产业开启“灵魂”跃迁新阶段
Magic8系列搭载了被誉为行业首个真正意义上的自进化AI智能体操作系统——荣耀MagicOS 10,在这一操作系统赋能上的YOYO,具备两大核心超能力:YOYO看见和YOYO执行,这意味着衣食住行购,都可以…

2025-10-17