ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

前OpenAI核心成员Karpathy:AGI需十年突破瓶颈,大模型与人类学习均有局限

时间:2025-10-21 19:27:38来源:快讯编辑:快讯

当业界普遍将2024年视为"智能体元年"时,卡帕西却提出这是"智能体的十年"。他以实习生类比当前AI智能体的能力局限:"要让它们真正胜任工作,必须突破多模态交互、持续学习、计算机操作等核心障碍。这些问题的解决需要十年时间,而非一两年就能完成。"这种冷静判断源于他对行业现状的深刻认知——尽管Claude、Codex等早期智能体已展现潜力,但距离可靠协作仍有巨大差距。

卡帕西近期开源的nanochat项目,意外暴露了大语言模型的致命缺陷。在构建这个仅需百美元训练成本的简易版ChatGPT时,他发现AI编程助手存在严重认知偏差:"这些模型过度依赖训练数据中的常见模式,导致定制化代码被误解,代码库被不必要的复杂性膨胀。"他举例说明,当自己放弃使用PyTorch的分布式数据并行容器时,AI助手仍坚持添加冗余模块,甚至引入废弃API,最终使代码变得混乱不堪。

对于强化学习这一主流训练方法,卡帕西的批判尤为尖锐。他将这种"用吸管吸监督信号"的方式形容为"既低效又荒谬":"人类学习不会通过数百次试错来强化某个结果,而是通过精细复盘理解过程。但强化学习却要把最终奖励信号的监督信息,艰难地分摊到整个行动轨迹中。"他指出,基于过程的监督虽然理论上更优,但实际操作中极易被大模型找到漏洞进行欺骗。

通过与人类学习方式的对比,卡帕西揭示了AI发展的两大根本性缺陷。其一是"模型坍缩"问题:当前AI被动预测数据的训练方式,导致生成内容多样性逐渐枯竭,形成隐性坍缩。其二是"过度记忆"困境:AI精确记忆训练数据的特性,反而阻碍了其发现通用模式的能力。"人类因记忆不完美而擅长抽象,AI却因过目不忘而困于细节。"他形象地比喻道,"这就像要求一个人同时记住所有细节,却失去了概括能力。"

在衡量AI进展的标准上,卡帕西反对使用抽象指标。他主张关注AI在经济任务中的实际表现:"AGI对宏观经济增长的影响将是缓慢而持续的,就像计算机、手机等技术一样,最终会融入GDP约2%的稳定增长曲线中。"这种观点源于他对历史技术变革的观察——无论是工业革命还是编译器出现,其影响都分散在长期的经济增长中,而非形成突变拐点。

尽管认为AGI实现仍需十年,卡帕西却坚信人类早已身处"智能爆炸"之中。他以宏观历史视角指出:"从太空俯瞰,地球正经历一场慢动作的烟花盛宴。这场变革不是突然发生的,而是数十年技术递归式自我提升的结果。"对于智能爆炸可能带来的失控风险,他提出深刻见解:"人工超级智能(ASI)可能使人类丧失对复杂自动化系统的理解,就像我们现在难以完全掌握神经网络内部运作一样。"

这场访谈在外网引发强烈反响,社交平台X上大量用户评价其为"必看内容"、"每分钟都充满洞见"。卡帕西的独特价值在于,他既描绘了AI发展的激动前景,又直指当前技术瓶颈。正如他所强调的:"通往AGI的道路没有捷径,唯有持续解决基础问题,才能让这场变革真正到来。"这种清醒认知,或许比技术狂热更能推动行业进步。

更多热门内容
DeepSeek新模型引热议:视觉路线成AI圈焦点,Karpathy等大佬怎么看?
这种方式或许可以解决大模型领域目前头疼的长上下文效率问题,更重要的是,如果「看」文本而不是「读」文本最终被确定为正确的方向,也意味着大模型的范式会发生重要的转变。 不过,值得注意的是,有不少研究者指出,De…

2025-10-21

谷歌CEO:OpenAI先推ChatGPT虽领先,却成谷歌加速AI产品推出的契机
令人意外的是,Pichai并未将ChatGPT的上线简单看作危机,而是视为“窗口已被打开”的转折点。 回顾谷歌自家的AI之路,Pichai提到:谷歌长期以来从基础设施、定制芯片、研究机构等多个维度布局AI,…

2025-10-21

​美国知名媒体主编预言:中国AI发展迅猛,五年内将制出顶尖AI芯片,未来更“酷”​
10月21日消息,近日,美国知名媒体《连线》杂志创始主编凯文·凯利在可持续全球领导者大会称,AI将帮助中国变得更加酷。“酷”意味着中国人能够拥有更好地生活,并且,中国文化将会传播到世界各地。 凯文·凯利还断言…

2025-10-21

阿里夸克“C计划”悄然推进 对话式AI应用或与字节豆包正面交锋
【CNMO科技消息】10月21日,有媒体报道称,阿里巴巴旗下智能搜索应用夸克正秘密推进一项代号为“C计划”的AI业务,该计划由夸克核心团队主导,通义实验室多位高级别成员参与,聚焦对话式AI应用布局,预计近日将…

2025-10-21

内蒙古高校AI专业受学子青睐:兴趣为帆,逐梦人工智能新蓝海
智能科学与技术专业大二学生潘滢如是班级里的“佼佼者”,她的课程表上排满了Java、数据结构、数据库等专业课,“大一公共课多,现在终于能深入学专业内容了,所有专业课我都感兴趣。” 王子熒是纪鑫宇的同班同学,他…

2025-10-21

远景张雷:中国或凭能源大模型领先,1-3年将见证其重大价值
但在物理人工智能、能源大模型方面,美国没有足够多的工业化场景和复杂能源系统来提供海量数据,在风机、储能等新能源制造方面也缺少实践,怎么搞得好?”他以远景赤峰零碳氢能产业园为例解释称,这个项目以全球最大绿色氢氨…

2025-10-21

青岛人工智能科技创新中心年内投用,聚焦机器人全产业链发展
近日,位于青岛市人工智能产业园内的青岛人工智能科技创新中心进入收尾阶段,年内将完工投用,该中心将布局机器人产业发展。 5号楼和6号楼均为5层标准工业厂房,重点布局传感器、伺服电机、减速器、关节模组等机器人核心…

2025-10-21

Claude升级助力生命科学,目标十年达成百年科研进展,成超人研究助手
智东西10月21日报道,今天,Anthropic宣布了一系列针对其AI模型Claude的改进措施,核心目标是提升Claude在生命科学领域的应用能力,从而加速科学进步。 在功能层面,Anthropic正通过…

2025-10-21

AI Agent从通才到专才:企业级市场的价值归真与生态协同新篇
在营销场景,众安信科的AI私域运营助理和智能推荐官等Agent,为保险公司、银行和零售品牌方构建两大核心能力:一是对客户进行全生命周期的精细化运营,二是精准推荐产品,从而实现高效转化与业务增长。 在此过程中…

2025-10-21