ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

谷歌新研究冲击缩放定律!模型规模真的关键吗?

时间:2024-04-09 16:27:49来源:ITBEAR编辑:快讯

【ITBEAR科技资讯】4月9日消息,近年来,模型规模不断扩大,一种普遍的信念是“力大砖飞”。

尽管OpenAI没有公布Sora的训练细节,但在其技术报告中提到了:最大的模型Sora能够生成一分钟高保真视频,这表明扩大视频生成模型是构建通用世界模拟器的有前景途径。

然而,谷歌最新的研究发现:并非如此!谷歌研究院和约翰霍普金斯大学在最新论文中指出:对于潜在扩散模型,模型不一定是越大越好。

据ITBEAR科技资讯了解,关于缩放定律的争议一直存在。OpenAI在2020年发表的论文提出,模型效果与规模大小、数据集大小、计算量强相关,而与具体结构弱相关。

缩放定律不仅适用于语言模型,还适用于其他模态及跨模态场景。这一概念的提出使研究人员和开发者能够更有效地设计模型架构,选择合适的模型大小和数据集规模,以实现最佳性能。

谷歌最新研究集中在图像生成模型上,提出对于潜在扩散模型,在计算资源有限时,增加计算量应该增加数据集大小,而不是模型参数量。

这是否意味着缩放定律失效了?作者的研究表明,在有限的计算资源下,较小的模型可以优于较大的模型;模型大小和训练步骤的选择需与计算资源相匹配。

然而,在训练步骤恒定的情况下,大模型仍然具有优势,尤其在处理图像细节方面。

研究者还发现,不同大小的模型在CFG(Classifier-Free Guidance)技术下受影响基本相同,这一发现令人意外。

这项研究探索了模型效率与品质之间的最佳平衡,为开发更高效的图像生成AI系统提供了指导。这与当前AI领域的趋势相契合,即小型语言模型在多项任务中超越大型对手,旨在推动AI技术的民主化。

更多热门内容
​软银54亿美元再出手,收购ABB机器人业务,布局AI生态新棋局​
财联社10月8日讯(编辑 马兰)瑞士工程公司ABB周三公告,已与日本投资公司软银集团签署协议,将旗下机器人业务部门以53.75亿美元的价格出售给软银集团,不再执行先前将该业务分拆为独立上市公司的计划。软银将…

2025-10-09

Gartner:2025年中国AI十大趋势,勾勒可持续创新发展蓝图
Gartner高级首席分析师费天祺表示:“中国在AI研发和部署方面取得了巨大进步,包括生成式人工智能(GenAI)技术,并且正凭借强大的设计、工程能力和日益完善的生态系统推动AI行业快速前进。 Gartne…

2025-10-09

科技与艺术交融!国内四家机器人乐队奏响多元场景音乐新乐章
该创新中心由浙江大学与杭州市余杭区联合共建,与浙江大学机器人研究院实行“两块牌子、一套班子” 运营模式,自 2024 年 8月揭牌以来,便以场景智能为核心推进技术研发与产业化落地。 2025 年 9 月,公…

2025-10-09

谷歌研发实力再显!AI去年斩获化学诺奖,量子计算今年又夺物理学奖
谷歌首席执行官Sundar Pichai迅速对此表示祝贺,并强调获奖者的研究为公司在量子计算领域取得的最新突破奠定了基础。John Martinis曾是谷歌的研究员,领导团队在2019年实现了“量子霸权”这…

2025-10-08