ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

Sora 2发布后,百度谷歌同日“上新”视频生成模型

时间:2025-10-17 03:16:08来源:快讯编辑:快讯

10月15日,百度宣布其视频生成模型“百度蒸汽机”完成重大升级,引发科技圈广泛关注。此次升级不仅突破了传统AI视频生成10秒左右的时长限制,更实现了AI长视频实时交互生成功能,标志着国内视频生成技术迈入新阶段。

据介绍,升级后的“百度蒸汽机”依托流式视频技术,首次在行业内实现AI长视频实时交互生成。用户上传素材后,可全程干预视频生成过程,包括暂停、修改提示词、调整剧情和画面等。该模型还支持图生视频和视频生视频双模式,满足不同场景下的创作需求。

在定价策略上,百度延续了首发时的性价比路线。蒸汽机Turbo有声版价格为2.5元/秒,首发双周优惠价为1.4元/5秒;C端用户可通过“绘想”平台充值会员,月费41元起。相比之下,OpenAI的Sora 2 API定价为0.1美元/秒起,C端用户需订阅ChatGPT Plus(20美元/月)或Pro(200美元/月)会员。

百度商业体系商业研发总经理刘林透露,此次定价基于工程优化能力、生成成本等多维度考量,未进行涨价或降价调整。他强调,百度蒸汽机的核心竞争力在于技术突破与用户体验的平衡。

除了长视频生成功能,升级后的“百度蒸汽机”还推出了可交互数字人与开放世界动态构建两大创新功能。数字人支持沉浸式双向互动,可应用于AI导购、教育、陪伴等场景;开放世界则允许用户在AI生成的环境中自由探索,如游戏地图、旅游景点和宇宙空间等。

百度工作人员表示,具备交互能力的长视频生成技术有望重塑人机互动模式,推动内容消费从“被动接收”向“共同创造”转变,甚至催生新的艺术形式和商业生态。

值得注意的是,在百度蒸汽机升级的同一晚,谷歌推出了视频生成模型Veo 3.1版。该版本在音频输出、精细化编辑控制和图像转视频效果方面均有提升,并新增视频扩展、首尾帧补过渡和图片引导风格控制三大功能。这一动向进一步加剧了全球视频生成赛道的竞争。

百度副总裁陈一凡指出,当前视频生成赛道技术差距尚未拉开,短期优势存在但无长期绝对领先。企业比拼的关键在于执行力和迭代速度。他透露,百度蒸汽机在产品层面虽支持无限时长生成,但考虑到用户应用场景,仍做了一定时长限制。

与此同时,百度搜索宣布全面升级文心助手AIGC创作能力,支持AI图片、视频、音乐、播客等8种模态创作。用户可通过百度首页按钮进入“文心助手”,一键调用多工具解决多场景问题。据百度搜索产品经理李想介绍,目前每天有千万量级的AIGC内容由用户创作产生,且已打通全模态生成。

以视频生成场景为例,文心助手提供“长视频生成玩法”。用户输入一段描述后,AI可自动完成情节设计、角色塑造、场景搭建、镜头运镜和声音配乐等全流程,生成一部3分钟的故事片。文心助手还集成“一句话写歌”“MV制作”“名场面模仿秀”等创作功能,以及超30种特效玩法模板,后续将上线音乐数字人分身功能。

在数字人领域,百度搜索发布了行业首个开放式实时互动的数字人智能体。该功能基于百度数字人技术、多模态模型和多智能体协作,支持用户与持证真人专家的数字分身进行1v1对话,提供法律、情感、旅游等场景的专业陪伴与咨询服务。

刘林透露,关于蒸汽机是否推出独立App的问题,百度目前优先满足内部业务需求,同时观察到专业创作者更多使用PC端。不过,App将作为未来规划方向之一。目前,包括蒸汽机在内的多项新技术已接入百度App。

更多热门内容
第138届广交会首期设服务机器人专区,前沿科技与商业应用共舞引关注
10月15日,境外采购商在第138届广交会服务机器人专区太希智能展台体验登山助行外骨骼穿戴设备。10月15日,境外采购商在第138届广交会服务机器人专区体验外骨骼穿戴设备。 10月15日,境外采购商在第1…

2025-10-16

TikTok广告投放进阶:用A/B测试精准锁定高转化“赢面素材”
但如果你在同时改了音乐、封面、文案,那你根本无法判断到底是什么在影响结果。如果你已经掌握了A/B测试的基础逻辑,下一步可以学习如何在TikTok Ads Manager中使用“自动化规则”和“预算分层策略…

2025-10-16