在科技界万众瞩目的期待中,OpenAI于北京时间8月8日凌晨终于揭开了GPT-5的神秘面纱。自2022年ChatGPT横空出世以来,OpenAI的每一次新品发布都如同科技界的春晚,吸引了无数目光。然而,此次GPT-5的亮相,似乎并未能完全满足外界的超高预期。
距离GPT-4发布已过去两年半,GPT-5的姗姗来迟无疑加剧了外界的期待值。从去年底开始,关于GPT-5发布时间的猜测便不绝于耳,社交媒体上更是炒得沸沸扬扬。OpenAI的CEO山姆·奥特曼更是亲自上阵,称其为“世界最强模型”,吊足了科技粉的胃口。
然而,发布当日,GPT-5的表现似乎并未如奥特曼所言那般神奇。尽管OpenAI为其推出了包括主流模型GPT-5、轻量版GPT-5 Mini、超轻量版GPT-5 Nano以及面向企业的高级版GPT-5 Pro在内的四个版本,全面覆盖了企业、开发者、普通用户的需求,但业内反响却远不及前作GPT-4那般轰动。
从产品端看,GPT-5最显著的变化在于使用上的简洁统一。过去OpenAI的模型名称繁多,让用户眼花缭乱。此次GPT-5的推出,终结了用户的选择困难症。价格方面,OpenAI也拿出了诚意,针对普通用户推出了限量免费策略,每5小时可免费发送10条信息,同时在API价格上也颇具竞争力。
尽管如此,不少熬夜观看发布会的应用者仍表示对GPT-5感到失望。一位大模型从业者表示,整体看下来,并未感受到GPT-5除了“刷榜”之外的模型架构优势,虽然数据集有所提升,但并未给人眼前一亮的感觉。另一位从业者则更为理性地认为,技术的发展从来都不是线性的,GPT-4的轰动效应让大家对GPT-5的期待过高。
实事求是地说,GPT-5在各项基准测试中的表现相较于上一代模型GPT-4o和o3都有所提升,特别是在编程表现上刷新了OpenAI历代模型的纪录。然而,在SWE-bench编程测试中,GPT-5的成绩仅比Anthropic公司发布的Claude Opus 4.1高出0.4%,并未明显拉开差距。
由于GPT-5的表现“不够惊艳”,甚至连马斯克都在社交媒体上公开表示“不服”,指出GPT-5在ARC-AGI-2基准测试上并未打败xAI公司开发的Grok 4。这一事件无疑进一步加剧了外界对GPT-5的质疑。
其实,在对GPT-5褒贬不一的背后,还隐藏着大模型训练已逐渐摸到天花板的困局。高质量训练数据供应不足、大规模预训练收益下降等问题使得GPT-5的提升难以像GPT-3到GPT-4那样实现明显飞跃。为了应对这一困局,OpenAI在GPT-5发布之前也加入了大模型“开源生态”的竞技场。
8月6日,OpenAI发布了自2019年以来的首批开源大语言模型GPT-oss-120b和GPT-oss-20b。尽管这两款模型在性能上表现出色,但在评估人物知识准确性的PersonQA测试中,GPT-oss-20b有53%的回答存在事实错误,幻觉率过高的问题被诟病。
尽管如此,OpenAI对开源态度的扭转仍具有重大意义。在开源生态日益繁荣的今天,要想持续保持技术领导地位,OpenAI已难再躺赢。此次OpenAI发布两款开源模型并与微软、亚马逊等巨头建立合作关系,无疑是在为未来的竞争铺路。
然而,GPT-5的发布并未能彻底打消外界的疑虑。在国内外科技巨头纷纷展开AI技术正面对垒的背景下,OpenAI面临的挑战愈发严峻。尤其是在企业级市场,OpenAI的市场份额正在被竞争对手蚕食。如何应对这些挑战,将是OpenAI未来需要深思的问题。
尽管面临着诸多挑战,但OpenAI依然拥有着庞大的用户基础和商业收入。最新数据显示,今年8月ChatGPT周活跃用户已达7亿,同比增长4倍。其付费用户数也从2024年的300万增至500万,Pro会员和企业版用户贡献了超60%的收入。然而,这些成绩并不能掩盖OpenAI面临的挑战和困境。
在未来的竞争中,OpenAI需要不断创新和突破,才能继续保持在AI领域的领先地位。这场人工智能的竞赛还远未到终点,未来的淘汰赛只会更加残酷。OpenAI能否在这场竞赛中笑到最后,让我们拭目以待。