近日,斯坦福大学以人为本人工智能研究所(Stanford HAI)公布了一份引人瞩目的《2025年人工智能指数报告》,该报告由李飞飞等人联合领导,揭示了中美两国在AI模型性能上的惊人趋近。
这份详尽的456页报告,广泛探讨了AI领域的多个维度,包括基准测试成绩、应用加速与投资趋势、中美AI模型的对比、公众认知的变迁以及AI硬件的发展概况。报告中的数据与见解,为全球AI的发展提供了宝贵的参考。
在AI性能的提升上,报告指出,2023年引入的MMMU、GPQA和SWE-bench三大基准测试中,AI系统的表现实现了质的飞跃。其中,MMMU的成绩提升了18.8个百分点,GPQA更是跃升了48.9个百分点,而SWE-bench的进步更是惊人,达到了67.3个百分点。生成高质量视频的技术也取得了重大突破,语言模型智能体在编程任务上的表现甚至超越了人类。
投资方面,生成式AI在2024年吸引了全球范围内的广泛关注,私人投资总额高达339亿美元,与前一年相比,增长率达到了18.7%。这一数据无疑表明了投资者对生成式AI未来发展的强烈信心。
在企业应用层面,生成式AI的普及速度令人咋舌。2023年,仅有33%的企业将生成式AI应用于至少一项业务职能中。然而,到了2024年,这一比例已经跃升至71%,实现了翻倍的增长。这充分展示了生成式AI在企业中的应用潜力和价值。
在中美AI模型的对比上,报告指出,虽然美国在AI模型数量上仍占据优势,2024年开发了40个值得关注的模型,而中国则开发了15个。但在MMLU和Humaneval等关键基准测试中,中美模型的性能差距已经大幅缩小。从2023年的两位数差距,到2024年的0.3%的微小差距,中美两国在AI模型性能上的竞争已经变得异常激烈。
报告还提到,中国在AI领域的论文数量和专利数量上仍然保持着领先地位。这进一步证明了中国在AI研究和创新方面的强大实力。