ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

Gemini Omni引领AI视频新变革:动动嘴就能剪视频,开启世界生成新纪元

时间:2026-05-21 05:57:36来源:快讯编辑:快讯

在今日凌晨的Google I/O大会上,谷歌DeepMind团队正式推出了革命性的AI模型Gemini Omni,这款被视为视频生成领域"Banana时刻"的新产品,正在重新定义人工智能与数字内容创作的边界。

不同于传统视频生成工具,Gemini Omni实现了从"生成内容"到"生成世界"的跨越。该模型不仅具备对动能、重力等物理规律的深刻理解,更能将复杂概念转化为直观的可视化场景。通过整合Gemini系列强大的推理能力与生成技术,新模型在多模态交互、视频编辑和世界模拟方面展现出突破性进展。

技术团队透露,Gemini Omni的训练方式与传统模型存在本质差异。其采用"多模态输入-多模态输出"架构,将图像、音频、视频和文本数据作为理解世界的原始素材,而非简单的附加条件。这种训练范式使模型能够自主掌握风格迁移、场景续写等未显式训练的能力——当用户要求将视频转换为蜡笔画风格时,模型能自动生成符合要求的版本;面对"走廊怪物出现"的开放式指令,系统可自然延续场景几何结构与人物特征。

产品负责人Nicole Brichtova在发布访谈中强调,这不是对Veo系列的常规升级,而是"从地基开始的重建"。团队耗时数月构建五条并行评估管线,在视频生成、编辑、图像生成、文本对齐和音频同步等维度进行综合优化。研究总监Shlomi Fruchter透露,模型展现出的"涌现能力"多次超出预期,例如通过音乐生成训练提升视频时间连贯性,利用绘画训练增强物理空间感知。

硅谷风投机构a16z合伙人Justine Moore指出,Gemini Omni的对话式编辑功能与数字分身技术具有颠覆性意义。用户现在可通过自然语言指令修改视频元素,甚至将个人形象植入历史场景。该模型在生物学解释、人体特写处理等领域表现尤为突出,例如能清晰展示蒙娜丽莎从颜料分子到原子结构的缩放过程。

DeepMind联合负责人Demis Hassabis坦言,这款模型代表着通往通用人工智能的重要一步。当被问及为何打破延续三年的命名体系时,团队成员表示:"这标志着技术路径的根本转变,我们正在构建能够理解并模拟真实世界的系统。"目前,谷歌已开放部分功能的体验申请,全球创作者正等待见证这场数字内容革命的全面到来。

更多热门内容
OpenAI联手谷歌升级AI图片溯源:隐形水印+C2PA双管齐下防伪造
IT之家注意到,该公司已承诺采用名为 C2PA 的开放标准,该标准会在图片元数据中留下明确标识,标注图片由人工智能生成。 OpenAI 还提前展示了一款图片核验工具,可同时检测上述两种溯源标识,方便用户快速…

2026-05-21

Seedance 2.1即将登场:视频质量提升20%,已占据80%视频生成算力份额
Sora已经退出了AI视频生成的舞台,基本上就是Seedance成为了绝对的王者,当然随着使用Seedance2.0的用户越来越多,字节也遭遇了前所未有的流量以及算力压力,同时消费者对于Seedance 2…

2026-05-21

谷歌Gemini Omni模型发布:跨模态交互升级,自然语言指令实现深度视频编辑
该模型支持文本、图像、音频、视频作为输入,实现跨模态生成与编辑。 Gemini Omni Flash 现已面向拥有 Google AIPlus/Pro/Ultra 订阅的用户在 Gemini 应用和 Goo…

2026-05-21

谷歌Android 17“接续流转”功能来袭,多设备任务切换将更便捷高效
谷歌还以谷歌文档和邮箱做了实操演示:其一,在手机打开谷歌文档,切换至平板后可在同一页面、保持原有编辑状态继续编辑;其二,手机端安卓版谷歌邮箱的邮件会话,可无缝流转到大屏设备的网页版邮箱,直接打开同一封邮件对…

2026-05-21

小米17 Max跑分曝光,大电池徕卡镜头加持,明日发布引期待
小米手机官方还在近日展示了小米17 Max和iPhone 17 Pro Max的长视频重度续航测试对比。 影像部分,小米17 Max首次搭载徕卡两亿像素主摄,还有Pro级的徕卡大底潜望长焦(70mm人像焦段…

2026-05-21

联想拯救者手机Y70新一代发布:旗舰配置搭配2K电竞屏,现已开启全款预售
新机亮点,比如2K电竞屏、乾坤散热、星环大电池、电竞Wi-Fi天线、AI游戏功能、新一代旗舰芯片等方面,大部分亮点以提升游戏性能为主,不愧是新一代游戏手机,各方面配置定位精准。功耗方面,采用芯片级AI功耗调…

2026-05-21

三星Galaxy S27系列将添新成员,S27 Pro 6.47英寸屏或携多项升级登场
同时,相关爆料显示,这款新增的Pro机型将是高端定位,与 S27 Ultra 共享部分技术基础,不过不支持 S Pen 手写笔。结合以上信息来看,下一代三星Galaxy S27 系列中隐私屏幕功能似乎还会…

2026-05-21

AI硬件新篇章:viaim讯飞智能体耳机发布,引领迈入Agent工作新纪元
如果只看功能列表,这似乎只是viaim讯飞AI会议耳机的一次软件升级;但如果站在公司战略的高度审视,这显然是未来智能一次清晰的跃迁。 马啸在演讲中回顾了未来智能的战略演进:1.0时代的AI会议耳机,解决的是…

2026-05-21

未来智能viaim讯飞智能体耳机发布:开启AI硬件“Agent时代”新征程
如果只看功能列表,这似乎只是viaim讯飞AI会议耳机的一次软件升级;但如果站在公司战略的高度审视,这显然是未来智能一次清晰的跃迁。 马啸在演讲中回顾了未来智能的战略演进:1.0时代的AI会议耳机,解决的是…

2026-05-21

AI硬件新纪元:未来智能viaim讯飞耳机引领工作流变革与进化
如果只看功能列表,这似乎只是viaim讯飞AI会议耳机的一次软件升级;但如果站在公司战略的高度审视,这显然是未来智能一次清晰的跃迁。 马啸在演讲中回顾了未来智能的战略演进:1.0时代的AI会议耳机,解决的是…

2026-05-21