ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

“AI教母”李飞飞携RTFM模型亮相,单芯片实时渲染3D世界开启新篇章

时间:2025-10-18 06:20:07来源:快讯编辑:快讯

美国华人科学家、斯坦福大学计算机科学教授李飞飞,因其对人工智能领域的卓越贡献,被誉为“AI教母”。近日,由她担任联合创始人兼CEO的World Labs公司,正式发布了一款名为RTFM(Real-Time frame Model,实时帧模型)的全新实时生成式世界模型,再次引发科技界广泛关注。

RTFM基于大规模视频数据进行端到端训练,是一款自回归扩散Transformer模型。其最大亮点在于无需依赖显式3D表征,仅通过输入一张或多张2D图像,即可生成不同视角下的全新2D图像。业内人士称其为“学会渲染的AI”,因其能够精准建模3D几何、反射、阴影等复杂物理现象,甚至可以利用稀疏照片重建真实场景。

据介绍,该模型具备高效性、可扩展性和持久性三大核心优势。在硬件配置上,仅需一块英伟达H100 GPU芯片,即可实现实时渲染持久且3D一致的场景,无论是真实空间还是虚拟想象场景,均能提供交互式体验。李飞飞团队在技术文章中指出,随着算力成本持续下降,生成式世界模型将从中受益,并逐步占据主导地位。

前谷歌高级工程师Rui Diao对RTFM给予高度评价,认为其解决了长期困扰世界模型可扩展性的问题。他指出,传统视频架构在生成交互视频流时面临巨大挑战,例如生成60帧的4K视频每秒需处理超过10万个token,而维持一小时以上的持续交互,上下文token将突破1亿大关。基于当前计算基础设施,这种方案既不可行也不经济。

空间智能的概念最早由美国心理学家霍华德·加德纳提出,指人类或机器在三维空间中的感知、理解和交互能力。对于人类而言,它包括以三维方式思考、重现和修饰影像的能力;对于机器而言,则是指其在三维空间中处理视觉数据、精准预测并采取行动的能力。李飞飞曾表示,视觉能力引发了寒武纪大爆发,而“我们想要的不仅仅是能看会说的AI,我们想要的是能做的AI”。

随着生成式AI技术的兴起,“空间智能+世界模型”成为实现通用人工智能(AGI)的重要路径之一。强大的世界模型能够实时重建、生成并模拟具有持久性、可交互且物理精确的世界,这将彻底改变软件、机器人等多个领域。李飞飞认为,空间智能与世界模型是解决AI技术难题的关键。

今年3月,李飞飞联合Ben Mildenhall、Justin Johnson、Christoph Lassner三位学者创立World Labs,致力于研发高效、可扩展的生成式世界模型。RTFM的通用端到端架构能够随数据与算力增长不断优化,而“带位姿帧空间记忆”与“上下文调度”技术则确保了场景的持久性,即使长时间交互也能保持一致性。

在融资方面,World Labs于今年9月宣布获得2.3亿美元(约合人民币16亿元)投资,由a16z、NEA恩颐投资和Radical Ventures领投,AMD、Adobe、Databricks的风投部门以及Shinrai Investments LLC参与,英伟达创投部门也加入其中。公司目前拥有约24名员工,其中华人约占三分之一,成立仅三个月估值便达到10亿美元(约合70亿元)。

投资人透露,World Labs的未来规划分为三个阶段:第一阶段构建对三维、物理以及空间和时间概念有深入理解的空间智能大模型LWM;第二阶段支持增强现实(AR)应用;第三阶段将模型应用于机器人技术,改进自动驾驶汽车、自动化工厂和人形机器人等领域。李飞飞表示,团队最早将于2025年推出产品,并承认在盈利模式等方面仍需突破。

除了World Labs,李飞飞还在推动Behavior视觉挑战比赛的发展。该比赛旨在解决机器人学习中的三大痛点:任务缺乏标准化、任务体系不统一以及训练数据不足。今年10月,她正式发布了Behavior 1K挑战,这是一个包含1000个任务的综合仿真基准与训练环境,聚焦于日常家庭环境中的“长时序任务”。Behavior为全球研究者提供了开放源码的训练与评测平台,促进不同机构在相同标准下进行比较和评估。

李飞飞近期表示,人类正处在一个文明性的转折时刻,语言、空间、视觉、具身智能等多种AI技术正在融合,并开始真正改变人类社会。她强调,只要始终将“以人为本”放在心中,这些技术就能成为造福人类的力量。

更多热门内容
红魔11 Pro+深度体验:风冷水冷双加持,游戏手机性能新巅峰
其中帧率高且稳得红魔11 Pro手机正面最高温度达到了48.4℃,背面最高温度45.7℃位于后摄模组右侧,但是从测温图中,可以看出有着水冷覆盖的机身下半区域温度比较低且均匀,控制在40℃左右。在高负载的游戏场…

2025-10-18

古尔曼爆料:苹果下一代MacBook Pro或取消刘海屏,配M6芯片与OLED屏
2025年10月17日,彭博社科技记者马克·古尔曼在社交媒体平台爆料称,苹果下一代MacBookPro将配备触摸屏,更轻薄、更轻薄,搭载M6芯片和OLED屏幕,价格可能也会更高。 此外,马克·古尔曼还透露,…

2025-10-18

全球首套中红外太阳磁场观测系统启用 助力太阳物理研究与空间天气预报
作为全球首台专用于中红外波段的太阳磁场测量设备,该项目自2015年启动研制以来,实现了多项关键技术突破。 在2023年建成后的调试与试观测阶段,AIMS望远镜已实现中红外波段太阳光谱和成像的常规观测,并成功获…

2025-10-18

华为AI WAN解决方案全面升级:以AI-Centric助力运营商迈向Net5.5G R2智能新阶段
华为数据通信产品线总裁王雷介绍,华为AI Centric的AI WAN解决方案通过AI智能设备、AI智能联接、AI智能大脑三层架构重新定义Net5.5G时代的IP承载网,助力运营商加速迈向以AI赋能的Net5…

2025-10-18

红魔11Pro系列发布:水冷风冷双散热,售价4999起开启电竞新体验
除了纯平设计,此次红魔11 Pro系列在外观上也延续了透明设计,推出两款透明配色:氘锋透明暗夜、氘锋透明银翼,还有暗夜骑士、银翼战神两款非透明款,共四款配色供用户选择,满足不同审美需求。同时还有红魔散热器、手…

2025-10-18

一加15与一加Ace6双旗舰10月27日亮相 性能拉满还有航天级材质与165Hz高刷屏
值得一提的是,一加15原色沙丘还将首发航天级纳米瓷金属材质,其表面硬度比钛金属高出134%,比不锈钢高出223%,比普通阳极铝合金更是高出344%,为手机提供了更加坚固耐用的保护。正面则搭载了一款由一加与京…

2025-10-18

卢伟冰开箱REDMI K90 Pro Max:三款配色亮相,性能影像全面跃升
快科技10月17日消息,今天下午,小米集团总裁卢伟冰开箱展示了REDMI K90 Pro Max的三款配色,分别是黑色、流金白和丹宁色。卢伟冰介绍,REDMI K90 Pro Max采用6.9英寸大R角直屏…

2025-10-18

vivo X300小直屏旗舰来袭:影像性能双突破,重塑安卓体验新标杆
影像系统是X300的核心亮点。得益于蔡司T*镀膜与蓝图极限追焦引擎,X300在夜景、运动、逆光等复杂场景下都能输出纯净锐利的画面。 vivo X300凭借全焦段影像系统、旗舰级性能与极致手感,重新定…

2025-10-18

2025年1500元手机怎么选?四款高性价比机型按需匹配你的使用场景
iQOO Z9 Turbo长续航版以骁龙8s Gen3处理器+6400mAh电池为核心卖点,性能接近旗舰级,可高帧率运行《原神》等大型游戏。 处理器:骁龙695(6nm制程,安兔兔跑分约40万)屏幕:6.6…

2025-10-18

​小米汽车公布网络攻击援助进展:23位车主初步判定可诉,下周启动立案联系​
10月16日,小米汽车公布关于小米车主受到网络攻击的进展:小米车主遭网络攻击专项援助信息收集表自9月26日发布以来,截止10月15日24:00,共计6032人参与,480人提供了相关证据信息,且对应所需的援助…

2025-10-18