ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

GPT-5全面评测:写作情商下滑,编程能力却大放异彩

时间:2025-08-08 14:45:13来源:数字生命卡兹克编辑:快讯团队

在万众瞩目之下,OpenAI的直播活动于凌晨1点准时拉开帷幕,标志着人工智能领域的新里程碑——GPT-5的诞生。

自2023年3月15日GPT-4震撼发布以来,仅仅过了两年半的时间,AI技术仿佛跨越了十年的进步。当时,GPT-4作为首个多模态模型,引发了全球范围内的轰动,人们对GPT-5的期待也随之高涨,纷纷预测它将在2023年下半年问世。

然而,时间的车轮滚滚向前,直到两年半后的今天,GPT-5才终于揭开了神秘的面纱。这个全新的AI系统由多个模型组成,包括一个处理常规问题的智能快速模型(gpt-5-main)和一个针对复杂问题设计的深度推理模型(gpt-5-thinking)。系统通过实时路由器,根据对话类型、复杂度和用户意图智能选择使用哪个模型。

GPT-5不仅在技术上实现了飞跃,还显著减少了事实性错误,提升了模型的准确性。相比GPT-4,gpt-5-main产生的重大事实错误减少了44%,而gpt-5-thinking相比前代产品则减少了78%。在更专业的基准测试中,GPT-5系列模型的表现同样出色,幻觉率远低于前代产品。

GPT-5在应对模型谄媚行为方面也取得了显著进步。与GPT-4相比,GPT-5在交流中更加细腻和深思熟虑,减少了不必要的表情符号和过度迎合的行为,使得与AI的对话更加自然流畅,仿佛与一位拥有博士级智能的朋友交谈。

在性能跑分方面,GPT-5同样表现出色。无论是数学竞赛、编程能力还是现实世界的知识测试,GPT-5都超越了前代产品,创造了新的记录。然而,尽管GPT-5在各方面都取得了显著进步,但也有一些用户对其写作和情商能力表示了不满,认为在某些方面还不如之前的GPT-4.5。

尽管如此,GPT-5在编程领域的表现却令人惊喜。在实测中,GPT-5展现出了强大的上下文精度和精准性,能够在生产级别的任务中完成精准修改,这是其他AI模型难以比拟的。这一特点使得GPT-5在编程领域具有极高的应用价值。

随着GPT-5的发布,OpenAI也推出了新的定价策略。对于使用GPT-5进行构建的开发者来说,每百万token的输入费用为1.25美元(享有90%的缓存折扣),而输出费用则为每百万token 10美元。这一定价策略旨在鼓励开发者更加高效地使用GPT-5。

在发布会结束后不久,一些用户陆续获得了GPT-5的使用资格。然而,也有用户发现他们的GPT-4.5版本被悄然替换为了GPT-5。这引起了一些用户的不满和怀念之情,他们纷纷表示对GPT-4.5的独特风格和细节处理感到惋惜。

GPT-5的发布标志着人工智能领域又迈出了坚实的一步。尽管它并非完美无缺,但在准确性、编程能力和用户体验等方面都取得了显著进步。随着技术的不断发展,我们有理由相信未来的AI将更加智能、更加人性化地服务于人类社会。

更多热门内容