ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

前谷歌研究员发声:AI发展不能盲目依赖算力,探索新方向才是关键

时间:2026-01-13 00:20:29来源:快讯编辑:快讯

过去十年,人工智能(AI)领域的创新似乎遵循着一条简单公式:增加参数数量、扩大数据规模、提升算力水平。然而,随着行业进入新的发展阶段,这种模式是否还能持续引领进步,已成为学界和产业界共同关注的焦点。当"算力决定一切"的信念逐渐渗透到整个领域的研究文化中,学术界因资源匮乏被边缘化、研究参与地域高度集中、资本投入导致发表传统封闭化等问题日益凸显。

前谷歌大脑研究员、Cohere前AI研究负责人Sara Hooker近期发表文章指出,深度神经网络领域持续扩展训练计算资源的效率正在急剧下降。当前模型训练中,大量资源被用于学习低频特征的长尾部分,而所有迹象表明,这种投入已进入收益递减阶段。在模型规模增长速度放缓的背景下,如何让模型从环境中有效学习并适应新知识,成为比单纯扩大规模更关键的问题。

一个值得关注的现象是,近年来多个领域出现小模型性能超越大型模型的案例。这种逆转趋势表明,模型规模与性能之间的关系正在发生根本性转变。研究发现,训练后的模型可以删除大量权重而不显著影响性能,但若在训练初期就限制权重数量,则无法达到同等效果。这种矛盾现象反映出深度学习技术本身存在效率问题——或许存在更优的学习方法,能够摆脱对庞大网络规模的依赖。

深度神经网络在学习效率方面存在显著缺陷:它们能快速掌握常见特征,却需要消耗大量算力来学习罕见特征。由于训练过程基于平均误差最小化原则,低频特征的信号在批量更新中被稀释,导致现实世界中大量低频属性的学习变得异常困难。人类智能能够高效处理这类长尾数据,而当前深度学习技术在这方面表现欠佳,大量计算资源被浪费在记忆长尾数据上。

数据质量对计算资源依赖度的降低作用正在显现。研究表明,通过去重、数据修剪和优先级排序等手段改进训练语料库,可以弥补模型规模的不足。这意味着可学习参数数量并非性能提升的绝对限制因素,提高数据质量能够减少对计算资源的需求。同时,指令微调、模型蒸馏、思维链推理、检索增强生成等新型算法技术,正在通过优化训练方式弥补计算量的不足,使相同资源能够产生更显著的效益。

模型架构设计对可扩展性的影响不容忽视。新架构的引入能够从根本上改变计算量与性能之间的关系,使现有的扩展规律失去意义。当前流行的Scaling Law(扩展定律)虽然对预训练测试损失预测有一定价值,但在真实下游任务中的表现往往混乱且不一致。这种理论局限性的根源在于,它试图用算力规模精确预测复杂系统的未来表现,而现实中的能力提升曲线常不符合幂律分布,不同领域的可靠性差异巨大。

行业正在经历方向性转变:一方面,短期内仍会继续扩大模型规模以榨取现有架构的剩余性能;另一方面,算力与性能的关系已变得难以预测,单纯依赖算力的路径正逐渐失去稳定性。前沿实验室开始将研究重心转向优化空间的根本性重塑,包括在推理阶段投入更多计算资源、通过搜索和工具调用提升表现、利用合成数据塑造训练分布等新方向。这些方法大多不依赖梯度更新,彻底偏离了以训练为中心的传统路径。

智能系统的发展重心正在从"更强模型"转向"更善互动的系统"。算法本身不再是唯一关键,交互方式、界面设计和多组件协同正在成为决定智能上限的重要因素。曾经属于人机交互领域的小众问题,如今已上升为计算机科学研究的核心议题。这种转变标志着AI发展进入新阶段,需要同时优化算法、数据和系统架构等多个维度。

现有以Transformer为核心的架构已显现明显的边际收益递减特征。随着模型开始持续与世界互动,如何避免灾难性遗忘成为关键挑战,而依赖全局参数更新的深度网络在持续学习方面存在先天局限。越来越多的迹象表明,下一次真正的技术跃迁需要全新的架构设计,能够形成相对独立、可专门化的知识区域,更接近人类大脑的学习方式。这种架构革新将成为突破当前发展瓶颈的关键所在。

更多热门内容
马斯克3小时访谈“放飞”:AI、机器人、未来货币,颠覆认知的预言来了
更劲爆的是他对 AI 进步速度的判断:目前的 AI 在智能密度上还有两个数量级的提升空间,也就是说,同样的硬件可以跑出 100倍更聪明的模型。 马斯克认为,如果你告诉 AI 公理 A 和公理 B 都是真的…

2026-01-13

Google云使用难题多?借力专业团队让云上之路更稳更省心
但如果你的团队是第一次接触GCP,或者没有搞过大规模迁移想的,这一步真挺容易踩雷的。专业的运维团队(比如通过MSP)有成熟的监控和报警系统,能自动响应常见问题,处理过各种奇葩故障,平均修复短修复,甚至能提供S…

2026-01-13

百度吴晨霞:AI浪潮下数字人进阶,成全域增长新引擎与交互核心
之前我们讲数字人,更多是说它的语言超过真人,2025年百度整体升级的慧播星数字人就是多模态,有以下几个变化:第一是视觉模型进化,以前数字人动作是循环的,最多对口型,现在数字人本身、动作、表情,甚至跟商品、环境…

2026-01-13

XREAL融资1亿美元估值超10亿!徐驰:XR行业拐点将至,眼镜成AI新载体
在徐驰看来,未来AR眼镜将呈现“轻量化AI助手”与“重显示娱乐办公”的二元化形态,在目前AI能力尚未支撑起合格的轻量化产品的情况下,XREAL优先布局后者。 时代财经:XREAL在CES上新发布的全球首款2…

2026-01-13

荣耀500系列携手泡泡玛特跨界合作,1月19日潮玩新机即将登场
IT之家 1 月 12 日消息,今日,荣耀手机向《科创板日报》记者确认,荣耀数字 500 系列将与泡泡玛特进行 IP联名合作,新机定位行业首款潮玩手机,将于 1 月 19 日发布亮相。 IT之家注意到,今日…

2026-01-12

联发科天玑9500s性能强劲对标骁龙8 Elite 小米REDMI Turbo新机有望首发
IT之家 1 月 12 日消息,博主 @数码闲聊站 今天在微博透露,联发科天玑 9500s 芯片在配置堆料方面“很猛”。博主表示,这款芯片的性能可以对标骁龙 8 Elite(骁龙 8 至尊版),在能效和重负…

2026-01-12

海信E8S电视深度体验:RGB-Mini LED技术加持,万元级画质新标杆
它将 9360 分区、100% BT.2020 色域、H7 信芯 AI 画质芯片、180Hz 原生高刷以及黑曜屏 Pro 等顶尖配置,通过RGB-Mini LED 技术完美融合,打造出了一款在画质、色彩、游…

2026-01-12

荣耀ROBOT PHONE亮相2026 CES:以AI与机器人融合,开启终端新纪元
在如今愈发同质化的智能手机市场,类似荣耀 ROBOT PHONE 这样让人眼前一亮的创新正变得越来越难得,特别是这次在 CES这样一个国际舞台上获得认可,一方面是荣耀 AI 技术领导力的集中体现,更深层次…

2026-01-12

某厂超薄Air工程机配置揭秘:对标苹果却因市场考量遭砍,或为小米新机
博主表示,这台手机还拥有 2 亿像素后置双摄,搭载高通骁龙 8 Elite Gen 5 处理器,电池容量好像不到 6K,厚度 5.xmm,重量16xg,带有 eSIM、超声波指纹等外围配置,完成度很高,但…

2026-01-12

卢伟冰转发消息:小米17系列成数字史最畅销,Pro系列创新交互体验
【环球网科技综合报道】1月12日消息,有博主此前发文透露,年底这波新旗舰,目前达成单品激活百万仅 3 台,包括小米 17 Pro Max、小米17 Pro 和华为 Mate 80。 小米集团合伙人、总裁,手…

2026-01-12