近日,谷歌旗下的DeepMind团队震撼发布了其最新的通用世界模型——Genie 3。这项技术革新,能够依据用户的文本输入,迅速构造出多样且互动性强的虚拟环境,为人工智能与虚拟现实的结合探索出一条前所未有的道路。
Genie 3的技术实力令人叹为观止:它不仅能以流畅的每秒24帧速率,生成清晰度达到720p的高清3D互动世界,还独创性地加入了“文本提示触发事件”功能。用户仅凭简单的文字命令,就能实时调整虚拟环境,极大地增强了体验的沉浸感和用户的创造力。
作为向通用人工智能(AGI)迈进的关键一步,Genie 3为AI实体提供了一个广阔且逼真的训练舞台。同时,它在游戏开发、教育模拟、创意产业等多个领域展现出了巨大的应用潜力。例如,仓库机器人可以在此模型创造的虚拟场景中安全地练习应对各种紧急情况,从而提升在实际工作中的表现。
然而,尽管Genie 3前景光明,但它仍面临一系列技术难题。目前,它支持的连续交互时间仅限于几分钟,远未达到理想水平。AI实体在模拟环境中的交互能力,特别是在处理复杂多智能体交互方面,仍有待大幅提升。
为了进一步完善模型并评估潜在的伦理问题,DeepMind目前正以研究预览的形式,向部分学者和创作者开放Genie 3,旨在收集专业的反馈意见,以推动其后续的迭代与升级。