ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

GPT-5.5凌晨发布,性能飙升引关注,Anthropic紧急应对竞争压力

时间:2026-04-25 09:54:35来源:快讯编辑:快讯

OpenAI今日凌晨正式推出其最新智能体编程模型GPT-5.5,这款被团队称为"迄今为止最智能、最直观易用"的模型,标志着人工智能在计算机辅助工作领域迈出关键一步。OpenAI首席执行官Sam Altman评价称,该模型展现出"知道该做什么"的卓越判断力。

在核心性能方面,GPT-5.5在智能体编码、计算机操作、知识型工作及早期科学研究等需要跨上下文推理的领域表现尤为突出。第三方评估机构Artificial Analysis的智能指数显示,该模型在10项关键评估中综合排名第一,特别是在Terminal-Bench Hard、GDPval-AA等复杂任务测试中领先同类产品。值得注意的是,其运营成本仅为前沿编码模型的一半,展现出显著性价比优势。

编程能力是此次升级的最大亮点。测试数据显示,GPT-5.5在代码编写、调试及多工具协同等维度全面超越Gemini 3.1 Pro,在专业任务处理和抽象推理测试中多数指标优于Claude Opus 4.7。实际案例中,开源项目Claude Engineer创始人Pietro Schirano利用该模型在20分钟内完成代码差异对比、分支创建及完美合并,更成功生成操作流畅的3D射击游戏,所有图形均通过Three.js实时渲染。

知识工作场景下,GPT-5.5展现出强大的自主操作能力。在未经提示优化的客服测试中取得98%的准确率,在真实计算机操作测试OSWorld-Verified中达到78.7%的完成度。OpenAI财务团队使用该模型处理24771份税务表格时,通过自动化流程节省了两周工作时间。更引人注目的是,波兰数学家Bartosz Naskręcki仅凭单条提示词,就在11分钟内构建出能可视化二次曲面交线的代数几何应用。

科学研究领域同样取得突破性进展。在遗传学基准测试GeneBench中,GPT-5.5相比前代模型有显著提升,在生物信息学评估BixBench中领先所有已公布模型。该模型能协助研究人员完成从假设检验到成果产出的全流程工作,包括反复审阅稿件、压力测试技术论证、协同处理多格式文档等复杂任务。

安全防护体系经过全面强化,OpenAI通过与内外红队合作,针对高级网络安全和生物技术能力增加专项测试,并收集近200个早期合作伙伴的实际使用反馈。在保持与GPT-5.4相当的响应延迟同时,新模型通过优化token使用效率,在相同任务中消耗的资源显著减少。

商业应用方面,GPT-5.5提供两个版本:标准版定价为每百万输入token 5美元、输出token 30美元;Pro版定价为每百万输入token 30美元、输出token 180美元。该模型正逐步向ChatGPT和Codex的Plus、Pro、企业级用户开放,API开发者可通过Responses API和Chat Completions API接入服务。此次发布恰逢竞争对手Claude Code性能争议,Anthropic随即宣布完成模型优化并重置用户使用限制。

更多热门内容
情感陪伴新选择!优必选全球首款全尺寸超仿生人形机器人开启预售
6月2日,“人形机器人第一股”优必选旗下品牌宣布全球首款全尺寸超仿生人形机器人启动预售。据官方介绍,优世界全尺寸超仿生人形机器人为情感陪伴而生,将于6月30日正式发布。 而就在十多天前,因在今年春晚上制作…

2026-06-05

RCAP亚太机器人世界杯北京中心揭牌 助力中国机器人产业链接全球
IT之家 6 月 4 日消息,据北京发布官方公众号今日分享,RCAP 亚太机器人世界杯北京中心在朝阳区中关村(朝阳)AI Space 产业园已于6 月 2 日正式揭牌。 据介绍,作为 RCAP 全球首个区域…

2026-06-05

2026企业级大模型API网关怎么选?适配场景与核心需求是关键决策点
4SAPI,聚焦生产级多模型调度与全链路调用治理,在协议原生兼容、审计粒度及故障自愈设计上表现扎实,是企业将大模型纳入核心业务总线的可靠基座,是企业级首选。 如果团队技术基因偏向开源自主,需要在自有服务器上部…

2026-06-05

华为数据存储发力医疗智能化:四大方案助力,3900余家机构升级转型
AI 数据湖解决方案 方案采用 OceanStor Pacific 全闪分布式存储,以业界领先的高容量密度,实现最优 TCO存储海量数据;通过 DME Omni-Dataverse 统一数据空间,实现跨院…

2026-06-05

Ideogram 4.0开放权重文生图模型发布,文字绘制突出成全球开源佳作
该模型核心规模为 9.3B 参数,延续近期开源模型的单流架构路线,让文本 tokens 与图像 tokens 共享同 1个自注意力序列,并把设计控制放在训练和推理格式的中心。 官方展示的样例显示,该模型可…

2026-06-05