ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

三维世界模型兴起,智能汽车将如何“预见”未来?

时间:2024-12-23 15:25:26来源:ITBEAR编辑:快讯团队

近期,科技界迎来了一波关于世界模型的创新浪潮,其中,由人工智能领域的领军人物李飞飞创立的World Labs公司率先发力,于12月初推出了其首个项目——大世界模型(Large World Model,简称LWM)。该项目通过一张图片即可将二维场景转化为三维空间,用户能在其中自由移动并切换视角,且生成的场景严格遵循空间原理和物理定律。

李飞飞透露,大世界模型仅是Worlds Labs迈出的第一步,公司未来的愿景是将这项技术融入增强现实(AR)、机器人乃至自动驾驶领域,进一步拓宽其应用场景。

紧接着,Google DeepMind也不甘落后,推出了Genie2,这款工具能够根据单张图片生成无限的3D世界,并应用于AI游戏及智能体训练中。这意味着Genie2不仅能够模拟虚拟世界,还具备物体交互、复杂角色动画、物理模拟以及预测其他智能体行为的能力。

随后,在OpenAI发布会直播的第三天,此前在理解和模拟现实领域备受瞩目的Sora也推出了其升级版Sora Turbo。Sora Turbo在模拟运动中的物理世界时,显著增强了其可编辑性,为构建与物理世界互动的模型迈出了重要一步。

世界模型的概念自2018年起逐渐受到广泛关注。科学家指出,人类通过有限的感官感知世界,并据此构建出一个简化的内部世界模型,这个模型不仅帮助我们理解世界,还指导我们预测未来。在计算机领域,世界模型同样基于有限且选择性的信息进行决策和预测,包含了观察、状态估计、动作建议和潜在变量建议等核心元素。

在智能汽车领域,世界模型的应用同样前景广阔。随着高通8295芯片的普及和AR-HUD技术的广泛应用,3D人机界面(HMI)正成为智能座舱发展的新趋势。用户可以通过3D方式探索整个座舱场景,实现多视角切换,这种连贯且直接的体验正在重塑座舱的交互和信息呈现方式。

AI在智能座舱中的快速应用正在构建视觉、听觉、语义等多模态融合的全新体验。虽然目前世界模型在座舱中的应用尚不成熟,但它预示着未来座舱将从被动接受指令转变为主动推荐和预测,并更加精准地融合人、车、外部环境的感知信息,实现千人千面的个性化体验。

在智能驾驶方面,世界模型同样展现出巨大潜力。2024年,自动驾驶端到端大模型成为车企竞逐的新焦点。这一模型取代了传统的感知、描述、预测及规划模块,通过统一的神经网络架构实现环境感知到车辆控制的全流程自动化,使自动驾驶更接近人类的真实驾驶。

蔚来汽车在其蔚来世界模型(NWM)中展示了世界模型在自动驾驶方面的应用潜力。NWM能够在极短时间内推演出多种车辆可能的轨迹,并根据外界信息不断更新内在时空模型,从而找到最佳驾驶决策。世界模型不仅降低了自动驾驶的训练成本,提高了开发速度,还为复杂场景的训练提供了可能。

随着科技公司的不断推动和演进,世界模型正逐步走向成熟,为智能汽车成为人们的智能出行伴侣或移动智能机器人奠定了坚实基础。

更多热门内容