ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

李飞飞新文解析:视频生成、机器人与NVIDIA的“世界模型”之争与分类新解

时间:2026-06-04 15:30:36来源:快讯编辑:快讯

在人工智能领域,“世界模型”已成为近期最受关注且争议不断的话题。自Sora被OpenAI定义为世界模拟器以来,各类技术纷纷冠以此名:从Genie的交互式画面生成,到机器人公司的研发方向,再到NVIDIA的Omniverse基础设施,甚至游戏引擎也被纳入这一概念框架。尽管术语统一,不同团队对“世界模型”的理解却大相径庭,导致行业交流中存在显著隔阂。

斯坦福大学教授李飞飞近日在个人专栏中提出一套功能分类法,试图厘清这一混乱局面。她以强化学习领域经典的“部分可观测马尔可夫决策过程”(POMDP)闭环为理论基础,指出当前被称作“世界模型”的技术实为该闭环的三种投影:渲染器输出视觉观测(像素),模拟器输出物理状态(几何与动力学表征),规划器输出智能体动作。这一分类标准基于输出内容与闭环环节的对应关系,为技术评估提供了清晰框架。

三类模型中,渲染器的商业化进程最为领先。以文本生成视频技术为代表的产品已覆盖消费级与企业市场,例如Google的Nano Banana模型用户规模可能达数亿。然而,这类模型的核心目标是视觉逼真度,而非物理准确性——其生成的华丽画面可能存在结构缺陷,无法直接用于建筑设计或机器人训练。相比之下,规划器虽被视为最具潜力的方向,但目前仍处于实验室阶段,真实场景部署面临复杂度、多样性与持续性的三重挑战。

模拟器则被李飞飞定义为连接两者的关键枢纽。该技术需在几何、物理与动力学层面构建世界的基础表征:向上可投射为人类可感知的视觉画面,向下可推导出智能体动作的物理后果。例如,NVIDIA的Omniverse平台已应用于工厂、仓库与数字孪生领域,其目标市场规模据估算超过万亿美元。但模拟器发展面临数据稀缺、计算成本高昂等瓶颈,尤其是同时模拟刚体、流体与布料等多物理交互的场景,其资源消耗仍远高于单一领域模拟。

当前行业最显著的趋势是三类模型的边界逐渐模糊。部分机器人实验室已证明,预训练视频渲染器可同时支持世界预测与动作预测,在单一架构内实现渲染与规划的融合。李飞飞团队开发的Marble模型则进一步突破,通过多模态输入生成可探索的3D环境,并同步输出高斯泼溅(用于视觉渲染)与碰撞网格(用于物理模拟),尝试统一渲染器与模拟器的功能。这种技术融合的逻辑终点,是一个能根据需求切换输出模态的基础模型——既可生成照片级画面,也能模拟物理交互,甚至规划动作序列。

尽管前景广阔,统一模型的实现仍面临多重挑战:渲染器依赖的互联网视频数据与模拟器所需的3D标注数据存在数量级差异;视觉优化目标与机器人精度需求可能产生冲突;单一架构内调和不同模态的张力仍是核心开放问题。但可以确定的是,渲染、模拟与规划三条技术路径的交汇,正在重新定义机器智能与物理世界的关系——这或许正是空间智能发展的终极方向。

更多热门内容
苹果新任CEO特纳斯调整战略:搁置Vision Pro,全力押注智能眼镜赛道
【环球网科技综合报道】6月4日消息,据Macrumors报道,苹果公司即将上任的首席执行官约翰·特纳斯已批准对VisionPro及智能眼镜业务进行重大战略调整,正式搁置Vision Pro后续产品计划,将…

2026-06-04

微信聊天记录误删别慌!4种官方恢复实测有效,关键时刻能“救急”
适用场景刚换了新手机,旧手机还在身边之前没有备份,但旧手机上的微信聊天记录还完整操作步骤在新手机上登录微信打开「我」→「设置」→「通用」→「聊天记录迁移与备份」选择「迁移到手机/电脑」(如果是旧手机迁到新手…

2026-06-04

Marvell美满电子迎新机遇:获谷歌TPU定制网络芯片设计订单
IT之家 6 月 4 日消息,科技媒体 Wccftech 昨日(6 月 3 日)发布博文,报道称 Marvell(美满电子)近期迎来多重利好消息,在被英伟达首席执行官黄仁勋预言成为下一个万亿美元公司后,最新消…

2026-06-04

齐向东谈AI时代网络安全:攻防失衡,构建“三位一体”防御体系破局
演讲中,齐向东提出AI时代网络安全的“三个攻防失衡”:攻击日益高效化、自动化、平民化;传统防护静态化、人工化、单点化,形同虚设;“AI+”赛道竞速中攻击方天然占优。 他强调,破局的关键在于实施“安全升级”,…

2026-06-04

一季度折叠屏手机市场:华为以60%份额强势领跑 荣耀紧跟其后表态学习
CNMO科技注意到,华为以60%的市场份额领跑行业;荣耀位居第二名,占比21%。 荣耀Magic V6的最大亮点之一在于,其顶配版内置7150mAh新一代青海湖刀片电池,硅含量达32%,能量密度为985Wh/…

2026-06-04

2026年安卓旗舰机推荐:这几款手机流畅不卡顿,上班族长期使用优选
小结:Find X9s Pro通过 “天玑9500旗舰芯片 + 潮汐引擎性能调度 + ColorOS 16极光引擎 + AI场景化优化” 的四重组合拳,构建了一个立体、动态的流畅保障体系,完美契合了“系统流…

2026-06-04

郭明錤透露苹果路线图调整:移除Vision Pro系列,转向AI眼镜布局
IT之家 6 月 4 日消息,北京时间周四凌晨,分析师郭明錤发帖称,苹果 XR 头显和智能眼镜路线图中仅剩两款智能眼镜产品可见。郭明錤还表示,这次重大调整由苹果下一任 CEO 约翰 · 特努斯(John T…

2026-06-04

Marvell美满电子获新机遇:将为谷歌设计TPU定制网络芯片 2027年量产
IT之家 6 月 4 日消息,科技媒体 Wccftech 昨日(6 月 3 日)发布博文,报道称 Marvell(美满电子)近期迎来多重利好消息,在被英伟达首席执行官黄仁勋预言成为下一个万亿美元公司后,最新消…

2026-06-04

苹果新任CEO或叫停Vision Pro后续计划 全力押注智能眼镜赛道
【环球网科技综合报道】6月4日消息,据Macrumors报道,苹果公司即将上任的首席执行官约翰·特纳斯已批准对VisionPro及智能眼镜业务进行重大战略调整,正式搁置Vision Pro后续产品计划,将…

2026-06-04

Q1中国折叠屏市场:华为独占鳌头,荣耀紧追,苹果入场成最大悬念
快科技6月4日消息,市场调研机构IDC公布的2026年第一季度中国折叠屏智能手机市场份额统计数据显示,华为依然稳稳坐稳行业第一的位置,龙头优势十分突出。作为定位阔折叠形态的重磅新品,Pura X自上市一年来…

2026-06-04