在万众期待之中,OpenAI的直播活动于深夜震撼开启,正式揭晓了备受瞩目的GPT-5。人工智能领域的飞速发展令人咋舌,仿佛仅仅两年半的时间,却带来了十年般的巨变。回想起2023年3月15日GPT-4的问世,那时它以首个多模态模型的身份惊艳亮相,让整个业界为之震惊,人们纷纷预测GPT-5会在同年下半年接踵而至。如今,经过漫长的等待,GPT-5终于揭开了神秘面纱。
GPT-5是一个综合系统,其核心包括两个主要模型:一个是处理常规问题的智能快速模型gpt-5-main,另一个则是专为复杂问题设计的深度推理模型gpt-5-thinking。系统通过实时路由器智能判断对话类型、复杂度和用户意图,动态选择最合适的模型进行响应。若提示中包含“认真思考这个”,便会启用gpt-5-thinking进行深入分析。这一路由器还会不断根据用户的使用情况进行优化,包括模型切换频率、回答偏好和准确性,随时间逐渐提升效能。系统还配备了处理高需求的小型版模型gpt-5-main-mini和gpt-5-thinking-mini,以及专为开发者打造的更小更快的nano版本gpt-5-thinking-nano。同时,Pro会员还能享受到并行计算能力的gpt-5-thinking-pro版本。这一系列模型共同构成了GPT-5,它继承了GPT-4和OpenAI 3的衣钵。
GPT-5在性能上的显著进步之一是大幅减少了事实性错误。与GPT-4相比,gpt-5-main产生的重大事实错误减少了44%,而gpt-5-thinking则比OpenAI 3减少了78%。在专业基准测试LongFact和FActScore中,无论是否启用网络浏览功能,GPT-5系列模型的错误率均远低于前代。尤其在启用网络浏览的情况下,gpt-5-thinking产生的错误比OpenAI 3少了五倍以上。GPT-5在应对模型谄媚行为方面也取得了显著进展,与GPT-4相比,它减少了不必要的迎合和表情符号的使用,交流更加细腻和深思熟虑,使得对话体验更接近与高水平智能朋友的交流。
OpenAI还推出了四个全新的性格设置,用户无需再编写复杂的Prompt,只需选择预设即可。这些预设包括愤世嫉俗者、机器人、倾听者和书呆子,为用户提供更多样化的交互体验。在性能跑分方面,GPT-5同样表现出色,不仅在AIME 0225数学竞赛中取得满分,还在现实世界编程能力、人类知识测试以及多模态能力上刷新了记录。尽管跑分显示GPT-5有所增强,但并未带来颠覆性的变化。
OpenAI在发布会上的表现略显草率,图表数据存在明显错误,如52.8大于69.1等于30.8,以及50小于47.4等,引发了网友的热议。尽管如此,GPT-5在各大评测榜单上仍然取得了全方位的第一名,不仅在性能上有所提升,还更加节能。在视觉推理、代理编程和研究生级别科学问题解决等能力上,GPT-5表现优于OpenAI 3,同时输出Token减少了50%-80%。
然而,GPT-5的发布并未带来新功能或特性,这在一定程度上引发了市场的不同反响。在发布会后不久,Polymarket上的预测显示,OpenAI与Google在AI模型竞争上的预期出现了波动。OpenAI宣布GPT-5在写作和编程方面取得了显著进步,并公布了开发者定价策略:每百万token 1.25美元(享受90%的缓存折扣),输出则为每百万token 10美元。发布会结束后,用户陆续获得了GPT-5的访问权限,但一些用户对GPT-4.5的消失表示遗憾。
一些用户认为,GPT-5在写作和情商能力上尚不及GPT-4.5。例如,在面对一个关于鲁迅吐槽咖啡厅的Prompt时,GPT-5的回答显得生硬且文风不符,而GPT-4.5则展现出了更加细腻的文笔。在情商测试方面,GPT-5的回答也显得较为生硬,与GPT-4.5相比有较大差距。用户在指令遵循方面对GPT-5的评价也较为一般。许多用户在GPT-4.5即将消失之际,纷纷与其进行最后的互动,表达不舍。
在编程方面,尽管OpenAI的历史表现并不突出,但GPT-5在实际应用中的表现却令人惊喜。一位用户试图开发粤语学习应用,在对比Claude 4 Opus、Gemini 2.5 Pro和GPT-5的UI和BUG后,更倾向于GPT-5的简洁和实用性。尤其在生产级别任务中的精准修改方面,GPT-5展现出了强大的上下文精度,获得了用户的高度评价。其他开发者也纷纷表示,GPT-5在可用性、精准性和综合体验方面是目前最好的选择之一。
GPT-5的发布不仅带来了技术上的革新,也标志着人工智能领域进入了一个新的发展阶段。从GPT-4到GPT-5的两年半时间里,人工智能从令人捧腹的拙劣表现,成长为了一个必须严肃对待的伟大力量。人们不再仅仅转发那些匪夷所思的截图,而是开始深入探讨人工智能对未来职业和社会的影响。尽管那段野蛮生长的日子已一去不复返,但人工智能的奇迹仍在继续,推动着整个世界不断前行。