ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

GPT-5发布后评价分化,奥特曼承认存在技术故障并回应质疑

时间:2025-08-09 16:29:51来源:凤凰网科技编辑:快讯团队

近日,科技界掀起了一场关于GPT-5的热议风暴。据彭博社报道,OpenAI的首席执行官萨姆·奥特曼在数月间不遗余力地宣传GPT-5的强大性能,将其发布誉为公司历史上的一个重要里程碑。然而,在GPT-5正式亮相后的24小时内,这款备受瞩目的新模型却收获了截然不同的评价。

在周四的盛大发布会上,OpenAI信心满满地宣布,GPT-5在编程能力和处理复杂推理问题上取得了显著进步,甚至足以将聊天机器人ChatGPT提升至“博士级专家”的高度。然而,随着用户的深入体验,一些不同的声音开始浮现。

尽管一些早期尝鲜者对GPT-5给予了肯定,但他们的评价中也不乏保留意见。开发者西蒙·威利森在一篇博客文章中坦言,尽管GPT-5是他目前最喜欢的新模型,性能出众且偶尔令人惊艳,但与之前的版本相比并未带来颠覆性的飞跃。

社交媒体平台上,ChatGPT的用户们对GPT-5持续存在的问题表达了失望之情。例如,编造信息、基础数学错误以及拼写问题依旧存在。本特利大学数学系副教授诺亚·詹西拉库萨更是直言不讳地表示,这次升级令人失望,虽然GPT-5确实有所改进,但幅度远未达到他的预期。

值得注意的是,部分用户的负面反馈或许源于对技术底层机制的误解。与OpenAI以往的模型不同,GPT-5能够根据查询内容自动调整使用不同复杂度的模型。这种设计旨在优化计算资源配置,但也意味着用户并不总能获得最强大的技术版本。

一个典型的例子是,在测试中当被问及单词“blueberry”中字母“b”出现的次数时,GPT-5最初错误地给出了“三次”的答案。然而,在得到“仔细想一想”的提示后,GPT-5似乎切换到了更高级的推理模型,并给出了正确答案。

面对用户的反馈,奥特曼在周五承认了系统存在的技术故障。他解释说,GPT-5的自动切换器在发布后的大半天时间内出现故障,导致模型表现异常迟钝。他承诺,从今天起,GPT-5将会变得更加聪明。

此次升级对OpenAI来说至关重要。面对来自美国和中国竞争对手的激烈竞争,OpenAI正努力保持领先地位。同时,为了维持AI研发所需的巨额投入,OpenAI还需说服企业用户和个人用户为其付费服务买单。

然而,随着AI系统的不断进步,评估各类服务的优劣变得越来越具有挑战性。尽管GPT-5在LMArena等多个用户评分排行榜上登顶,但在另一个基准测试ARC-AGI-2中,GPT-5却落后于埃隆·马斯克旗下xAI的最新版Grok。

在缺乏明确评估标准的情况下,模型之争往往更多地依赖于用户的个人感受。如今,每周有近7亿人使用ChatGPT,难免会有人对模型的表现持不同看法。对于个人生活与工作的价值评估来说,短短一天的时间显然远远不够。

宾夕法尼亚大学沃顿商学院的教授伊桑·莫利克经常试用各种AI模型,他对GPT-5的研究能力、机智的文字应答以及编程简化功能(即便是对新手而言)表示赞赏。他认为,GPT-5能够自主完成各种任务,有时甚至是超凡脱俗的、奇怪的或非常AI式的任务,而这正是其最迷人的地方。

然而,在社交论坛Reddit上,用户的反应却大相径庭。在周五的“有问必答”活动中,奥特曼面对了一些用户的质疑。这些用户对自己无法掌控和了解具体由哪个模型响应查询感到不满。奥特曼表示,OpenAI将采取措施解决这些抱怨,包括提高系统的透明度。

在活动中,当奥特曼回应一位Reddit用户关于GPT-5写作质量的问题时,他指出OpenAI认为GPT-5的某个版本在写作质量上优于GPT-4.5。然而,这一观点并未得到所有用户的认同,不少用户纷纷表示,他们觉得GPT-5的写作质量反而更差。

更多热门内容