ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

Claude Sonnet 4.5重磅登场:30小时超长续航,编程实力与功能创新双突破

时间:2025-09-30 10:55:33来源:互联网编辑:快讯

人工智能领域编程能力竞争再度升级,Anthropic公司正式推出新一代编程模型Claude Sonnet 4.5,在多项技术指标上实现突破性进展。这款被称作"全球最强编程模型"的新品,在真实编程场景测试中力压群雄,同时将AI持续工作时长提升至30小时以上,引发行业高度关注。

在权威编程测试平台SWE-bench Verified的最新评估中,Claude Sonnet 4.5以显著优势登顶榜首。该测试专门考察模型解决实际编程问题的能力,涵盖代码修复、功能扩展等复杂任务。更令人瞩目的是,在模拟真实计算机操作的OSWorld基准测试中,新模型取得61.4%的准确率,较四个月前的前代产品提升近20个百分点,创下该测试历史新高。

这款模型展现出惊人的持续工作能力,可连续30小时保持高效编程状态。对比此前Claude Opus 4和Codex等模型最多7小时的独立工作时间,新模型在耐力方面实现质的飞跃。实测显示,其能一次性完成约1.1万行代码的编写任务,相当于开发一个完整聊天应用的代码量。

技术升级带来显著效率提升。开发者反馈显示,新模型在代码重构任务中表现突出,某次调用中同时完成25次工具调用、新增3000余行代码并生成12个全新文件。虽然生成的模块化代码首次运行存在缺陷,但其架构设计的优雅性获得专业人士认可。Cursor等开发工具平台证实,该模型在处理长周期编程任务时,错误率较前代降低37%。

伴随模型发布,Anthropic同步推出多项开发工具创新。Claude Code新增"检查点"功能,支持开发进度实时保存与回溯;原生VS Code插件实现终端界面全面升级;API服务整合代码执行与文件创建功能,开发者可在对话中直接完成全流程开发。最受关注的是Claude Agent SDK的开放,这套构建智能体的底层框架,解决了记忆管理、权限控制等关键技术难题。

定价策略延续亲民路线,新模型API调用费用与前代持平,每百万tokens收费3至15美元。安全性能方面,通过强化对齐训练,模型在防范欺骗行为、抵制权力诱惑等维度取得突破性进展。测试数据显示,提示注入攻击的防御成功率提升至92%,内容误判率下降至0.7%以下。

市场反应呈现两极分化。部分开发者惊叹于其代码生成效率,称"这是首个能真正参与企业级开发的AI模型";也有用户指出生成的代码需要较多人工调试。技术社区出现有趣现象:尽管两个月前遭遇"降智"风波导致部分用户流失,但新模型发布后,原Codex用户中出现回流趋势,GitHub相关讨论量周增45%。

竞争格局因新模型发布再度生变。当前Anthropic估值达1830亿美元,年化营收突破50亿美元,其中编程工具贡献超四成收入。面对OpenAI和谷歌Gemini的激烈竞争,公司选择在对手年度开发者大会前夕发布新品,战略意图明显。联合创始人Jared Kaplan透露,更强大的Opus系列模型将于年内推出,暗示大小模型协同发展的技术路线。

创新功能"Imagine with Claude"引发技术圈热议。该临时研究预览仅向高级订阅用户开放五天,其核心突破在于实现软件功能的实时生成与调整。所有界面元素和底层代码均在用户交互过程中动态创建,这种"所见即所建"的开发模式,为AI辅助编程开辟全新路径。技术分析师指出,该功能若能稳定运行,将重新定义人机协作的边界。

更多热门内容
科技赋能秋收:河北板栗“智”长、黑龙江蔓越莓“速”收、新疆棉花“巧”脱叶
在河北秦皇岛市抚宁区的板栗科技示范基地里,一颗颗果实饱满的板栗挂满了枝头。 据了解,棉花在成熟采收之前,需要提前一个月向棉株喷洒脱叶剂,加快叶片脱落,避免叶片过于稠密影响棉桃采光生长,也能防止棉花采收过程中…

2025-09-30