ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

GPT-5重大更新引热议:用户评价“无聊”,商业化野心显露

时间:2025-08-08 14:28:32来源:凤凰网科技编辑:快讯团队

在万众期待中,OpenAI于北京时间8月8日凌晨正式揭晓了其新一代大语言模型GPT-5的神秘面纱,并出乎意料地宣布基础版将对所有用户免费开放。这一举动立即引发了全球范围内的广泛关注与讨论。

OpenAI的首席执行官山姆·奥特曼在发布会上激情洋溢地表示,如果说GPT-4还只是个初出茅庐的大学生,那么GPT-5无疑已经成长为了一位真正的专家。他形容这次的技术升级是一次“让我再也回不去”的飞跃,其体验堪比第一款配备视网膜屏的iPhone所带来的震撼。

GPT-5此次以一个统一系统的姿态亮相,摒弃了以往常规模型和单独推理模型的划分,而是由三大核心部分组成:一个智能高效的基础模型,足以应对大多数问题;一个专为解决复杂问题设计的深度推理模型GPT-5 Thinking;以及一个能够根据对话类型、复杂度、工具需求及用户指示快速判断应使用哪个模型的实时路由器。

据OpenAI宣称,GPT-5是迄今为止最为强大的AI系统,在编程、数学、写作、医疗、视觉感知等多个领域均实现了前所未有的突破。然而,发布会刚刚落幕,网络上便涌现出不少质疑之声,人们纷纷发出疑问:这就是万众瞩目的GPT-5时代?

不过,从GPT-5的“屠榜”表现来看,其实力不容小觑。在最新的数学推理测试AIME 2025中,GPT-5在无工具模式下的得分高达94.6%,几乎逼近人类顶尖水平;在编程验证测试SWE-Bench中,它更是以74.9%的得分大幅超越上一代模型;而在多模态理解的MMMU基准测试中,GPT-5也取得了84.2%的优异成绩,证明了它不仅能准确理解文字,还能深入解析图片、图表、视频等多模态内容。

新版本GPT-5引入的“实时路由器”技术,使其能够根据任务复杂度自动选择推理模式,既保证了推理的深度,又有效减少了算力的浪费。简而言之,GPT-5学会了“先思考,再行动”,实现了效率与精度的双重提升。

奥特曼在发布会上还强调,GPT-5让他首次感受到,他们的主力模型已经足够强大,足以应对向一位真正的博士级专家提出的任何问题。他还特别提到,GPT-5最酷的能力之一便是能够即时生成高质量软件,按需软件的概念将成为GPT-5时代的标志性特征之一。

在编程能力方面,GPT-5的表现堪称史上最强。在OpenAI的测试中,该模型在多个基准测试中的编程表现均优于其他所有模型。在真实世界编程测试中,GPT-5在SWE-bench Verified中的得分为74.9%,在Aider Polyglot中的得分更是高达88%。

发布会现场,OpenAI负责后训练工作的扬·杜布瓦还亲自演示了如何用GPT-5快速生成一个带有互动游戏的法语学习网站。短短几秒钟内,GPT-5便写出了数百行代码,并成功生成了网站的前端界面。杜布瓦随后浏览了网站的各项功能,一切正常运作。

此次GPT-5还加入了四种交互人格——愤世嫉俗者、机器人、倾听者、书呆子,使得用户不仅能获得精准的答案,还能体验到不同风格的沟通方式。据测试,这一改进使得“谄媚式回答”减少了60%以上,让对话更加真实、有棱角。

GPT-5此次的升级还包括支持用户自定义聊天窗口的色彩风格,以及具备长期对话记忆的集成能力。更它还能直接与谷歌邮箱、日历无缝对接,从而全方位融入用户的生活与工作,为用户精准规划日程,贴心提醒重要纪念日。

在医疗健康领域,GPT-5也取得了显著进步。在HealthBench测试中,GPT-5得分46.2%,能够解析复杂的医疗报告并提供实用建议,为远程医疗、健康咨询等领域带来了新的可能。

微软、Cursor等平台已迅速接入GPT-5,编程辅助工具市场或将迎来新一轮的洗牌。有网友预测,GPT-5的普及将让更多人能够轻松写出高质量代码,甚至可能导致部分初级程序员面临失业风险。与此同时,教育、科研、设计等行业的AI渗透速度也将进一步加快。

然而,尽管GPT-5此次升级带来了诸多亮点,但OpenAI的商业化野心也引发了不少争议。根据最新官方公告,ChatGPT的周活跃用户已达到7亿,每天处理的用户消息量突破30亿条。付费用户数从6月的300万增至目前的500万,年化收入从100亿美元增至130亿美元,预计年底将突破200亿美元。对商业乃至更大用户群体的追求,让OpenAI的考量变得复杂。

今年5月,山姆·奥特曼还任命了一位新CEO——菲吉·西莫,作为“应用CEO”,她负责领导OpenAI的产品、业务和其他职能。这位曾在Facebook任职十余年的女将,显然是为下一阶段ChatGPT的增长和商业化而来。尽管奥特曼曾表示他将更专注于研究、计算和安全系统,但从GPT-5的表现来看,其商业化步伐似乎并未完全兼顾技术创新。

更多热门内容