ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

GPT-5.5定价翻倍却更高效,Codex生态升级成焦点,Claude紧急修复降智

时间:2026-04-24 19:14:52来源:互联网编辑:快讯

OpenAI最新发布的GPT-5.5模型引发行业震动,其API定价较前代GPT-5.4直接翻倍,达到每百万token 5至30美元。尽管价格显著提升,但官方强调新模型在任务处理效率上实现突破,单位任务所需token数量大幅减少,配合与英伟达GB200/GB300芯片的协同设计,推理速度提升20%。OpenAI总裁Greg Brockman在发布会上将其定义为"新一代智能范式",而CEO Sam Altman更直言用户实际使用成本可能更低。

性能对比数据显示,GPT-5.5在复杂推理和长文本处理领域展现压倒性优势。在Terminal-Bench 2.0测试中,该模型以82.7%的准确率远超Claude Opus 4.7的69.4%;长文本检索任务MRCR v2的完成度从GPT-5.4的36.6%跃升至74.0%,而Opus 4.7仅达32.2%。不过在代码修复专项测试SWE-Bench Pro中,GPT-5.5以58.6%的成绩落后于Opus 4.7的64.3%,暴露出特定场景下的技术短板。

实际应用场景中,新模型已展现惊人效能。某税务机构利用GPT-5.5自动审核24,771份K-1税表(总计71,637页),将原本需两周的工作压缩至实时完成;数学领域,该模型参与Ramsey数渐近证明研究,将数月的人工分析时间缩短至可接受范围;OpenAI内部调研显示,85%的员工每周使用Codex工具进行开发工作。

定价策略与生态布局成为本次发布的核心焦点。OpenAI同步推出Codex桌面端重大更新,新增浏览器控制、文档处理、系统级语音交互等功能,并宣布订阅用户可在JetBrains、Xcode等第三方工具中直接调用服务。这种"订阅制开放平台"模式与Anthropic的封闭API策略形成鲜明对比,后者近期刚封锁了通过订阅接口调用Claude的第三方服务。

技术路线之争在测评数据中愈发激烈。独立开发者@bridgemindai在发布当日先指出GPT-5.5在SWE-Bench Pro测试中落后,随后又承认其在长时间推理任务中的绝对优势。宾夕法尼亚大学教授Ethan Mollick提出"锯齿状技术边界"理论,认为AI能力发展呈现非均衡特征,不同测试场景下的表现差异将重构行业评价标准。

生态卡位战已进入白热化阶段。OpenAI通过延迟API发布、升级Codex生态、开放第三方接入等组合拳,试图将用户锁定在应用层。开发者Simon Willison逆向破解Codex认证机制后,OpenAI不仅未封杀反而半官方鼓励,其CLI工具随即开源。这种开放策略与Anthropic坚守API利润率的做法形成战略分野。

研发节奏的加速超出外界预期。GPT-5.5与前代发布间隔仅月余,OpenAI首席科学家Jakub Pachocki公开表示"过去几年的发展速度令人意外地缓慢"。内部人士透露,研究人员已开始使用新模型进行"隔夜实验"——提交算法构想后,模型可通宵运行并生成完整分析报告。这种从助手到合作伙伴的角色转变,预示着AI研发范式的深刻变革。

竞争对手的动态为这场技术竞赛增添新变量。就在GPT-5.5发布当日,Anthropic官方账号承认Claude模型存在"降智"问题并完成修复,这一举动被网友解读为对OpenAI新品的被动回应。测评机构数据显示,修复后的Claude在幻觉率等指标上仍与GPT-5.5存在显著差距,后者在该项测试中取得86%的成绩,虽较前代89%略有下降,但仍保持行业领先地位。

更多热门内容
工厂自动化改造:RS485与工业以太网如何抉择?共存方案还是全面替代?
新建项目或大规模产线改造,没有历史包袱,从一开始按工业以太网规划,长期维护成本更低;现有RS485网络节点数量多、轮询周期过长,已经成为生产效率的瓶颈;业务上有设备数据实时上云、远程运维、数字孪生等需求,需…

2026-06-02

2纳米芯片:摩尔定律下的技术突围与多芯片封装新路径
从历史上看,实现这一目标的最佳方法是缩小晶体管、导线和存储单元的尺寸。从钴到钌的过渡似乎还要过一段时间,但我们将在底层互连和布线等特定领域看到它的应用。这实际上取决于中介层的尺寸以及我们将要生产的封装类型,…

2026-06-02

融云斩获出海品牌与技术双奖 CEO董晗荣膺科创女性影响力殊荣
在扬帆出海主办的PAGC 2026大会上,融云一举拿下“出海热度品牌”与“优秀出海产品技术服务”两项金帆奖;同期,全球人工智能大会GAIC 2026将“开箱即用AI服务领军企业奖”授予融云的对话式AI分身;而…

2026-06-02

智绘数字安全蓝图 共筑网安创新生态 2026网络安全产业峰会在京圆满收官
本次峰会由中关村科技企业家协会网安创新企业分会(安创会)主办,中关村科技企业家协会、中关村软件应用技术创新联盟、中关村华安关键信息基础设施安全保护联盟共同指导,建恒信安、安盟信息、江民科技、上元信安、锐西科技…

2026-06-02

宇树科技单款人形机器人累计下线近1.1万台,IPO拟募42亿加速发展
IT之家 6 月 2 日消息,2 日(今天)下午,Unitree 宇树官方公众号发文宣布:截至 2026 年 5月,宇树单款人形机器人累计生产下线约 11000 台。该数量为一款双足人形的数量,不含其他型号…

2026-06-02

苹果watchOS 27即将登场:心率追踪升级、新表盘亮相、Siri功能增强
新的 Siri 在 iOS 27、iPadOS 27 和 macOS 27 上会更接近聊天机器人式体验;Apple Watch 端是否会有独立Siri App 仍未确定,但它预计能处理更复杂的请求,并提升…

2026-06-02

苹果WWDC前夕爆料:Siri将推独立App,大模型赋能开启全场景服务新篇
来源:环球网 据彭博社等外媒披露,新版Siri跳出过往弹窗唤醒形态,转型为对标ChatGPT的通用对话 AI,打通系统底层权限,可调用手机本地短信、相册、日程、文档等全量个人数据,结合联网搜索实现全场景服务…

2026-06-02

宇树科技人形机器人成绩亮眼:单款累计下线约1.1万台,出货量全球领先
PChome6月2日消息,宇树科技官微官宣,宇树单款人形机器人累计生产下线约1.1万台。宇树科技特别强调,这1.1万台仅为一款双足人形的数量,不含其他型号人形机器人或轮式底盘人形。 据了解,宇树科技2016…

2026-06-02

扣子3.0三端全量更新:AI团队协作新架构 多端协同开启工作新体验
扣子3.0提出了AI团队协作方式的全新架构,Agent可以被创建、接入和随时调度,扣子的网页端、桌面端和手机App端,则让Agent有机会与用户的文件、本地设备和工作场景接通。 扣子3.0支持接入本地Agen…

2026-06-02