ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

AI距人类智能有多远?杨立昆:缺失四大核心,世界模型成破局之道

时间:2025-05-27 20:12:10来源:ITBEAR编辑:快讯团队

在人工智能领域的最新动态中,meta首席人工智能科学家杨立昆在巴黎举办的AI Action Summit上发表了引人深思的见解。他指出,尽管人工智能在多个领域已展现出惊人的能力,但仍未能掌握理解物理世界、持久记忆、逻辑推理以及分层规划这四大人类智能的核心特征。

杨立昆,这位图灵奖得主,与IBM AI负责人安东尼·安农齐亚塔共同探讨了智能行为的基准定义。他们一致认为,从相对聪明的动物到人类,都具备这四种基本智能特征。然而,当前的AI,尤其是大语言模型,尚未触及这一门槛。杨立昆认为,要实现这些能力,必须对训练范式进行根本性的变革。

据他所述,目前科技巨头们为现有AI模型添加的种种功能,如为理解物理世界而训练的独立视觉系统,或为实现记忆功能而采用的检索增强生成技术等,都只是权宜之计。杨立昆倡导的“世界模型”架构,则是一种更具前瞻性的解决方案。这种架构通过现实场景的训练,具备比传统模式识别AI更高的认知水平。

“世界模型”能够获取某一时间点的世界状态,并预测采取特定行动后的新状态。然而,由于现实世界的演化充满无限不可预测性,杨立昆认为,抽象化是训练“世界模型”的唯一途径。meta开源的V-JEPA模型正在进行相关实验,通过预测视频缺失片段来学习,关键在于构建视频的抽象表征,而非进行像素级的预测。

在硅谷举行的Google I/O 2025开发者大会上,谷歌也透露了打造AI时代操作系统的计划,这一操作系统能够理解物理环境并代人类进行推理决策,本质上也是一个“世界模型”。自2024年末以来,DeepMind首席执行官德米斯·哈萨比斯一直在完善“世界模型→通用AI助手”的理论体系。此次I/O大会上,谷歌CEO桑达尔·皮查伊与Gemini负责人乔希·伍德沃德共同强调了这一愿景。

谷歌的这一举措,不仅展现了其对“世界模型”的重视,更将其与短期战略紧密结合,独树一帜。若能成功打造出理解物理环境的“通用AI助手”,谷歌或将成为连接用户、企业与技术的关键桥梁。对于追求尖端AI技术的企业而言,利用谷歌的“世界模型”研究、多模态能力及其AGI发展路径,将开启全新的创新篇章。

杨立昆揭示的AI四大能力鸿沟,不仅揭示了现有模型的局限性,更为技术突破指明了方向。meta通过V-JEPA模型探索抽象表征训练,谷歌将“世界模型”纳入操作系统级战略,这些行动本质上都在重构AI与物理世界的交互方式。这场角逐的深层意义在于,将AI从模式识别的工具升级为具备物理世界理解能力的认知主体。随着行业从“打补丁”式优化转向架构级创新,我们或许正站在通用人工智能(AGI)发展的关键节点上。

更多热门内容
SAP牵手阿里巴巴,共绘AI赋能数字化转型新蓝图
5月27日,阿里巴巴集团与SAP宣布达成战略合作,将SAP行业领先的企业级软件与阿里云基础设施及AI能力结合,加速企业客户的创新和数字化转型。阿里巴巴集团还将部署SAP商业AI、SAP业务技术云平台(BTP)…

2025-05-27