GPT-5发布后评价分化，奥特曼承认存在技术故障并回应质疑-信息流-ITBear科技资讯

近日，科技界掀起了一场关于GPT-5的热议风暴。据彭博社报道，OpenAI的首席执行官萨姆·奥特曼在数月间不遗余力地宣传GPT-5的强大性能，将其发布誉为公司历史上的一个重要里程碑。然而，在GPT-5正式亮相后的24小时内，这款备受瞩目的新模型却收获了截然不同的评价。

在周四的盛大发布会上，OpenAI信心满满地宣布，GPT-5在编程能力和处理复杂推理问题上取得了显著进步，甚至足以将聊天机器人ChatGPT提升至“博士级专家”的高度。然而，随着用户的深入体验，一些不同的声音开始浮现。

尽管一些早期尝鲜者对GPT-5给予了肯定，但他们的评价中也不乏保留意见。开发者西蒙·威利森在一篇博客文章中坦言，尽管GPT-5是他目前最喜欢的新模型，性能出众且偶尔令人惊艳，但与之前的版本相比并未带来颠覆性的飞跃。

社交媒体平台上，ChatGPT的用户们对GPT-5持续存在的问题表达了失望之情。例如，编造信息、基础数学错误以及拼写问题依旧存在。本特利大学数学系副教授诺亚·詹西拉库萨更是直言不讳地表示，这次升级令人失望，虽然GPT-5确实有所改进，但幅度远未达到他的预期。

值得注意的是，部分用户的负面反馈或许源于对技术底层机制的误解。与OpenAI以往的模型不同，GPT-5能够根据查询内容自动调整使用不同复杂度的模型。这种设计旨在优化计算资源配置，但也意味着用户并不总能获得最强大的技术版本。

一个典型的例子是，在测试中当被问及单词“blueberry”中字母“b”出现的次数时，GPT-5最初错误地给出了“三次”的答案。然而，在得到“仔细想一想”的提示后，GPT-5似乎切换到了更高级的推理模型，并给出了正确答案。

面对用户的反馈，奥特曼在周五承认了系统存在的技术故障。他解释说，GPT-5的自动切换器在发布后的大半天时间内出现故障，导致模型表现异常迟钝。他承诺，从今天起，GPT-5将会变得更加聪明。

此次升级对OpenAI来说至关重要。面对来自美国和中国竞争对手的激烈竞争，OpenAI正努力保持领先地位。同时，为了维持AI研发所需的巨额投入，OpenAI还需说服企业用户和个人用户为其付费服务买单。

然而，随着AI系统的不断进步，评估各类服务的优劣变得越来越具有挑战性。尽管GPT-5在LMArena等多个用户评分排行榜上登顶，但在另一个基准测试ARC-AGI-2中，GPT-5却落后于埃隆·马斯克旗下xAI的最新版Grok。

在缺乏明确评估标准的情况下，模型之争往往更多地依赖于用户的个人感受。如今，每周有近7亿人使用ChatGPT，难免会有人对模型的表现持不同看法。对于个人生活与工作的价值评估来说，短短一天的时间显然远远不够。

宾夕法尼亚大学沃顿商学院的教授伊桑·莫利克经常试用各种AI模型，他对GPT-5的研究能力、机智的文字应答以及编程简化功能（即便是对新手而言）表示赞赏。他认为，GPT-5能够自主完成各种任务，有时甚至是超凡脱俗的、奇怪的或非常AI式的任务，而这正是其最迷人的地方。

然而，在社交论坛Reddit上，用户的反应却大相径庭。在周五的“有问必答”活动中，奥特曼面对了一些用户的质疑。这些用户对自己无法掌控和了解具体由哪个模型响应查询感到不满。奥特曼表示，OpenAI将采取措施解决这些抱怨，包括提高系统的透明度。

在活动中，当奥特曼回应一位Reddit用户关于GPT-5写作质量的问题时，他指出OpenAI认为GPT-5的某个版本在写作质量上优于GPT-4.5。然而，这一观点并未得到所有用户的认同，不少用户纷纷表示，他们觉得GPT-5的写作质量反而更差。