ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

比DeepSeek贵了400倍,GPT-5.2想钱想疯了?

时间:2025-12-13 10:19:33来源:差评.PIN编辑:快讯

比 DeepSeek 贵 400 倍,比谷歌的 Gemini 3 Pro 贵将近 10 倍。

OpenAI 刚刚发布的 GPT-5.2 ,到底是什么水平?

这么说吧,这家伙或许是最适合打工人的AI,因为它很可能开启了 AI 从人类助手到专家的转变。

首先是在专业知识上,GPT-5.2 有 7 成的把握,能打败正在屏幕前,刷视频的各位行业专家们。

只看跑分的话,这次的 GPT-5.2 在各个维度上,都要比 Gemini 3 Pro 高了那么一点点。

当然,也只高了一点点,不排除 OpenAI 是对着 Gemini 刷分的可能。

但这次 OpenAI 最在意的,其实是最后的这个 GDPval 测试成绩。

这是他们在今年的925提出来了的一个全新测试方式,用来衡量 AI ,能否真的来帮打工人完成工作。

于是他们找了九个领域四十四个行业的专家们过来,结合他们的工作环境来出了一堆题目。

然后来看 AI 能否完成这些专家们的工作。

而结果就是,最新的 GPT-5.2 能在七成的工作上,打平,甚至做的比人类更好。

咱们也简单的体验了一下这个新模型,让 GPT-5.2 去互联网上统计这些 AI 公司发布的所有模型。

然后把这些模型在各个排行榜上刷出来的分数给统计下来,最后按照月份,把这些成绩给做成表格。

结果在整整 14 分钟的思考后。GPT-5.2 成功的帮咱们把这一系列数据收集,结果统计,表格绘制的任务都给完成掉了。

这么个完成度,确实看起来不错。

除此之外,GPT-5.2还能完成一些复杂的表格工作,做出来的表格不但比过去的自己做的表格要美观许多。

而且在各项任务的测试指标上,也有了 9% 左右的提升。

在写代码这块,GPT-5.2 也有了不少的提升,

产生幻觉的概率要比之前降低了 38%

属于是想让大家能用的更加放心了。

我们也简单的测试了一下,但可能是因为有了 Gemini 珠玉在前的缘故,GPT-5.2 给我的感觉,就有那么一些平平无奇了。

让它来写个 Aimlab (练习瞄准的小游戏)

它也确实能写出来,写出来的程序不但能跑,还能调整靶子大小,游戏时长这些基本参数。

这些都没啥毛病,但就是有些太中规中矩了。

审美这块,有点被上个月发布的 Gemini 3 给暴打了。

同样一句话做出来的小游戏,Gemini 已经开始考虑各种时髦的配色了,GPT 还在刷大白墙,做毛坯房。

当然,也有可能是我没有指定 GPT 要做成啥样的缘故。

除了各项工作能力的提升之外,这次 GPT-5.2 还有一个非常有趣的变化。

它变的更能听得懂人话了。

有人在测试的时候发现,让 GPT 写 50 个创意,它就会认认真真的去写 50 个创意,而不是像过去的模型一样,写 10 个点子就开始摆烂。

除此之外,在上下文能力上方面,OpenAI 也补强了一波,在插针实验中,即便是文本长度到了 256K,成功率依旧是接近百分之百。

这相当于几十万字的名著里,你偷偷在几个地方加了点料,骂了我几句,他都能精准找出来。

这对于写代码、搞学术、总结整理文书的打工人、科研狗来说,又是一大增强。

虽然上面的纸面实力这么强,但,还是在一些地方翻了车。

比如在官方展示的图像识别案例上,大伙们发现,Gemini 3 Pro 的颗粒度直接爆杀 GPT 5.2.

也有人吐槽,新模型发了,那老版本估计又要降智了。。。

属于是经典老番了。

最后呢, GPT-5.2 的发布,其实也让咱们看到了一种趋势。

那就是在未来,顶级模型之间的差异,也可能越来越明显,各个都偏那么一点点科。

比如 Gemini 可能在全模态领域一骑绝尘;GPT 在逻辑推理、生产力方面,也依旧走在同行前头;Claude则在代码能力和写作上,继续遥遥领先。

毕竟在怎么实现 AGI 这个问题上,大厂们的差异已经凸显。谷歌可能觉得,多模态能感知世界才是未来;OpenAI则信仰极致的逻辑推理和生产力的提升;Anthropic 认为高维度的语义理解和对齐,才能通往 AGI。

反正 AI 大哥位置轮流坐的现状,还在继续,按顺序来,下一个出招的应该是Anthropic 了。

更多热门内容
宇树G1机器人拆解:硬件成本透明,软件算法成核心竞争力与盈利关键
3月30日,中邮证券电新团队分析师苏千叶、盛炜、杨帅波发布《宇树G1人形机器人拆解报告》,对宇树科技核心在售产品G1基础版进行了完整的硬件拆解,从BOM成本、供应链到各子系统逐一解析,并给出毛利率测算与竞争…

2026-04-01

易普集两月内连获两轮亿级美元融资 阿里云高瓴创投等纷纷加码布局
作为易普集B+轮融资的重要参与方,DecarbonizationPartners看重易普集的预制模块化数据中心平台能提供一体化解决方案,能以更高效、更具成本效益的方式支持数据中心的基础设施建设。 万仁俊表…

2026-04-01

iPhone16Pro升级iOS26.5beta1体验:续航增强信号稳,流畅控温值得升
更完iOS26.5beta1之后,网络确实优化了不少,现在坐地铁打王者延迟基本都稳在40毫秒以下,在线刷超清电影直接点就看,根本不用等缓冲,一天大部分时候信号都是满格的。 以上就是iPhone16Pro升级i…

2026-04-01

小米17Pro:4099元起享旗舰体验,性能影像续航皆出色!
在4000-5000元价位段,小米17Pro凭借其强大的性能、出色的影像、持久的续航和创新的设计,成为了性价比旗舰的无冕之王,让更多消费者能够以实惠的价格享受到旗舰级的体验。 小米17Pro配置的创新“妙享背…

2026-04-01

出货带检测报告的手机取卡针怎么选?专业工厂核心优势与选购指南来了
不少采购商会面临找不到专业配套工厂、产品适配性差、售后无保障等问题,尤其是需要出货带检测报告的手机取卡针,对工厂的生产资质、品控体系有着更高要求。其手机取卡针作为核心主打产品,依托专属冲压车间与10台80吨冲…

2026-04-01

小米验厂辅导怎么选?佰斯特咨询15年经验助企业高效通关
小米验厂辅导的口碑与用户反馈 从市场反馈来看,佰斯特咨询的小米验厂辅导服务在珠三角、长三角地区拥有较多合作客户,不少工厂反馈,机构的辅导团队能精准抓住小米审核的核心扣分点,比如员工考勤合规、环保设施达标、…

2026-04-01

2026年3月智能手机选购指南:从影像到游戏,哪款手机匹配你的生活方式?
荣耀 Magic8 Pro 外观呈现出典型的科技风,背部采用流光砂感玻璃,中框为航空级铝合金,摄像头模组延续缪斯之眼设计,自研能效增强芯片E2 配合超导六方石墨烯散热结构,让五代至尊骁龙核心在驱动 720…

2026-04-01

小米手机怎么选?这三款高性价比机型闭眼入,512GB大内存畅用五年
相比红米K80,红米K90的起步价格更贵,12GB+256GB版本的首发价格为2599元,12GB+512GB版本更是贵了300元,但在第二天小米就宣布降价300元,重新回到红米K80的价格,遗憾的是只有1…

2026-04-01