ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

谷歌Gemini Omni多模态大模型发布:支持混合输入,对话实时编辑生成多元内容

时间:2026-05-20 13:33:02来源:互联网编辑:快讯

在谷歌2026 I/O开发者大会上,一款名为Gemini Omni的全模态大模型正式亮相,成为全场焦点。这款模型突破了传统AI在模态处理上的割裂状态,实现了文本、图像、音频、视频等多种信息形式的深度互通与自由生成。

Gemini Omni的核心能力被概括为“任意输入、任意输出”。无论是手绘草图、文字描述,还是图片、音频、视频素材,用户都可以自由组合输入模型。系统能够自主解析信息逻辑,并模拟真实物理规则,最终生成高精度、符合现实逻辑的多元化内容,包括视频、图像和文本等。

支撑这一强大功能的是谷歌的三大核心技术底座:世界模型Genie、图像模型Nano Banana和视频生成模型Veo。这三项技术共同构建了Gemini Omni的全模态AI框架,使其能够处理复杂的多模态任务。

在发布会上,Gemini Omni的对话式实时编辑能力成为最大亮点。与传统AI生成工具一次性输出、修改繁琐不同,这款模型支持用户在生成过程中通过自然语言对话进行交互式迭代优化。例如,用户可以精准调整视频场景、修改物体材质或调整动态特效,而修改过程不会破坏画面的整体逻辑和物理效果。

现场演示中,工作人员仅用手绘简易图形和文字指令,便生成了一段带有物理碰撞效果的完整特效视频。这一展示直观展现了Gemini Omni在内容创作领域的强大潜力,为AI技术的应用开辟了新的可能性。

更多热门内容
国产AI大模型降价潮来袭:DeepSeek与小米“逆市”出招,行业面临新考验
小i说:最近国产AI这波降价潮确实太猛了,DeepSeek和小米接连把API价格打到“地板价”,在全球算力成本飙升的大背景下,这种逆市操作看着确实亮眼。盲目低价也容易模糊行业的定价体系,万一有厂商为了压缩成…

2026-05-31

黑龙江大学朱敬华团队科研突破 论文被国际顶级数据挖掘会议KDD 2026录用
近日,黑龙江大学计算机与大数据学院(网络安全学院)朱敬华教授团队在数据挖掘与知识发现领域取得重要科研突破。 该论文的成功录用,不仅展现了黑龙江大学学者面向国际前沿的学术潜力与探索精神,也是计算机与大数据学院…

2026-05-31

无人机新规来袭!商业飞行和“大块头”必须买保险,小无人机也建议安排
对于重量超过2500克的无人机,不管你是个人玩还是商业用,都必须购买第三者责任险。 如果你用的是2500克以下的消费级无人机,比如常见的大疆Mini系列,目前还没有强制买保险的要求。不强制,但还是建议大家买…

2026-05-31

黑龙江大学朱敬华团队科研突破 论文被国际顶级数据挖掘会议KDD 2026录用
近日,黑龙江大学计算机与大数据学院(网络安全学院)朱敬华教授团队在数据挖掘与知识发现领域取得重要科研突破。 该论文的成功录用,不仅展现了黑龙江大学学者面向国际前沿的学术潜力与探索精神,也是计算机与大数据学院…

2026-05-31