GPT-5发布，科技春晚略显平淡，用户期待与实际表现存差距-信息流-ITBear科技资讯

在科技界万众瞩目的期待中，OpenAI于北京时间8月8日凌晨终于揭开了GPT-5的神秘面纱。自2022年ChatGPT横空出世以来，OpenAI的每一次新品发布都如同科技界的春晚，吸引了无数目光。然而，此次GPT-5的亮相，似乎并未能完全满足外界的超高预期。

距离GPT-4发布已过去两年半，GPT-5的姗姗来迟无疑加剧了外界的期待值。从去年底开始，关于GPT-5发布时间的猜测便不绝于耳，社交媒体上更是炒得沸沸扬扬。OpenAI的CEO山姆·奥特曼更是亲自上阵，称其为“世界最强模型”，吊足了科技粉的胃口。

然而，发布当日，GPT-5的表现似乎并未如奥特曼所言那般神奇。尽管OpenAI为其推出了包括主流模型GPT-5、轻量版GPT-5 Mini、超轻量版GPT-5 Nano以及面向企业的高级版GPT-5 Pro在内的四个版本，全面覆盖了企业、开发者、普通用户的需求，但业内反响却远不及前作GPT-4那般轰动。

从产品端看，GPT-5最显著的变化在于使用上的简洁统一。过去OpenAI的模型名称繁多，让用户眼花缭乱。此次GPT-5的推出，终结了用户的选择困难症。价格方面，OpenAI也拿出了诚意，针对普通用户推出了限量免费策略，每5小时可免费发送10条信息，同时在API价格上也颇具竞争力。

尽管如此，不少熬夜观看发布会的应用者仍表示对GPT-5感到失望。一位大模型从业者表示，整体看下来，并未感受到GPT-5除了“刷榜”之外的模型架构优势，虽然数据集有所提升，但并未给人眼前一亮的感觉。另一位从业者则更为理性地认为，技术的发展从来都不是线性的，GPT-4的轰动效应让大家对GPT-5的期待过高。

实事求是地说，GPT-5在各项基准测试中的表现相较于上一代模型GPT-4o和o3都有所提升，特别是在编程表现上刷新了OpenAI历代模型的纪录。然而，在SWE-bench编程测试中，GPT-5的成绩仅比Anthropic公司发布的Claude Opus 4.1高出0.4%，并未明显拉开差距。

由于GPT-5的表现“不够惊艳”，甚至连马斯克都在社交媒体上公开表示“不服”，指出GPT-5在ARC-AGI-2基准测试上并未打败xAI公司开发的Grok 4。这一事件无疑进一步加剧了外界对GPT-5的质疑。

其实，在对GPT-5褒贬不一的背后，还隐藏着大模型训练已逐渐摸到天花板的困局。高质量训练数据供应不足、大规模预训练收益下降等问题使得GPT-5的提升难以像GPT-3到GPT-4那样实现明显飞跃。为了应对这一困局，OpenAI在GPT-5发布之前也加入了大模型“开源生态”的竞技场。

8月6日，OpenAI发布了自2019年以来的首批开源大语言模型GPT-oss-120b和GPT-oss-20b。尽管这两款模型在性能上表现出色，但在评估人物知识准确性的PersonQA测试中，GPT-oss-20b有53%的回答存在事实错误，幻觉率过高的问题被诟病。

尽管如此，OpenAI对开源态度的扭转仍具有重大意义。在开源生态日益繁荣的今天，要想持续保持技术领导地位，OpenAI已难再躺赢。此次OpenAI发布两款开源模型并与微软、亚马逊等巨头建立合作关系，无疑是在为未来的竞争铺路。

然而，GPT-5的发布并未能彻底打消外界的疑虑。在国内外科技巨头纷纷展开AI技术正面对垒的背景下，OpenAI面临的挑战愈发严峻。尤其是在企业级市场，OpenAI的市场份额正在被竞争对手蚕食。如何应对这些挑战，将是OpenAI未来需要深思的问题。

尽管面临着诸多挑战，但OpenAI依然拥有着庞大的用户基础和商业收入。最新数据显示，今年8月ChatGPT周活跃用户已达7亿，同比增长4倍。其付费用户数也从2024年的300万增至500万，Pro会员和企业版用户贡献了超60%的收入。然而，这些成绩并不能掩盖OpenAI面临的挑战和困境。

在未来的竞争中，OpenAI需要不断创新和突破，才能继续保持在AI领域的领先地位。这场人工智能的竞赛还远未到终点，未来的淘汰赛只会更加残酷。OpenAI能否在这场竞赛中笑到最后，让我们拭目以待。