ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

Runway年末放大招!发布通用世界模型GWM-1及系列变体,还升级Gen-4.5

时间:2025-12-13 15:56:17来源:互联网编辑:快讯

人工智能领域再掀热潮,知名AI视频生成公司Runway正式推出其首个通用世界模型GWM-1,并同步发布三款创新变体产品,为虚拟环境构建、数字人交互和机器人训练提供全新解决方案。此次技术突破基于其最新升级的Gen-4.5视频生成架构,在实时交互、物理模拟和跨模态生成方面实现重要进展。

作为核心产品的GWM-1采用自回归架构设计,通过逐帧预测机制实现连续场景生成。该模型突破传统视频生成框架,支持用户通过调整相机视角、修改操作指令或输入音频信号进行实时干预。在环境模拟方面,GWM-1衍生出GWM Worlds子模型,用户仅需提供静态场景参考,即可在虚拟空间中自由移动探索,系统会自动生成包含物理光照效果的连贯环境。更引人注目的是,该模型允许通过文本指令动态修改物理规则,例如切换重力模式或约束运动轨迹,为智能体训练提供可定制的虚拟实验场。

数字人交互领域迎来突破性进展,GWM Avatars模型通过音频驱动实现高度拟人的视频生成。该系统可精准控制面部肌肉运动,确保口型与语音完美同步,同时生成自然的眼神交流和手势动作。在长达数分钟的交互过程中,数字人能保持稳定的形象表现,支持从写实到卡通的多种风格化渲染。这项技术已确定开放API接口,预计将广泛应用于教育辅导、客户服务、心理治疗等场景,其低延迟特性更使其成为VR/AR设备的理想交互方案。

机器人训练领域迎来重要工具革新,GWM Robotics通过学习型模拟器突破物理限制。该模型在海量机器人操作数据基础上构建预测系统,能够根据机械臂动作生成逼真的视频序列。在策略训练环节,系统可生成包含新物体、复杂指令和动态环境的合成数据集,有效提升模型泛化能力。更值得关注的是其策略评估功能,研究人员无需部署实体设备即可在虚拟环境中测试机器人决策模型,这种安全高效的验证方式可降低80%以上的硬件损耗成本。配套发布的Python SDK支持多视角视频生成和长序列处理,已与多个主流机器人框架完成兼容性测试。

此次技术升级同步带来Gen-4.5架构的重大更新,新增原生音频生成与编辑模块。新系统支持从环境音效到人物对话的完整音频合成,用户可精确控制声音的时空定位和情感表达。在视频编辑方面,创新的多镜头控制系统允许对初始场景进行无限扩展,通过参数调整实现整体风格的无缝转换。这项突破使得单段视频素材可衍生出多种叙事版本,显著提升内容创作效率。

更多热门内容
上海尖峰智能实验室启航:聚焦类脑大模型 探索AI与脑科学融合新路径
在2025年AI驱动科学研讨会上,天桥脑科学研究院创始人陈天桥首提“发现式智能”理念,尖峰智能实验室正是这一理念的重要落地载体之一。 在今天的主旨论坛上,中国科学院院士、广东省智能科学与技术研究院院长张旭表…

2025-12-13

GPT-5.2发布引热议:性能表现不一,清北华人团队成幕后关键力量
出乎意料都是,一个GPT-5.2实测翻车的帖子,在X上火了。对于这个视频,很多网友大加赞叹:GPT-5.2不仅遵循了指令,还在代码中选择了非常合理的审美和结构。 在下面这个实例中,它在单个文件中就构建了一…

2025-12-13

OpenAI 4人小队28天打造安卓版Sora,Codex助力85%代码自动生成
IT之家在此援引博文,回到 10 月,Sora iOS 版上线后使用量迅速爆发,人们立刻开始源源不断地生成视频,安卓版呼之欲出,但当时OpenAI 内部只有安卓端 Sora 的原型版本,因此这项开发任务可…

2025-12-13

苹果macOS 26.2 Tahoe系统来袭,雷雳5集群等多功能升级体验佳
12 月 13 日消息,据科技媒体 Apple Insider 今天报道,苹果 macOS 26.2 Tahoe系统现已正式发布,在提升系统性能的同时,为视频通话、提醒事项、多电脑集群等带来新功能。 用户更…

2025-12-13

飞腾与中国移动强强联合:国产“中国芯”赋能5G扩皮基站新飞跃
d6.a6b8.cn|支持3GPP要求的加解密算法,将直接影响基站安全与效率的加解密操作由软件执行变为由硬件执行,显著提升了性能并降低了功耗。中国移动研究院无线所高级技术专家曹晋宇高度评价,“它证明国产核心芯…

2025-12-13