Claude Sonnet 4.5重磅登场：30小时超长续航，编程实力与功能创新双突破-人工智能-ITBear科技资讯

人工智能领域编程能力竞争再度升级，Anthropic公司正式推出新一代编程模型Claude Sonnet 4.5，在多项技术指标上实现突破性进展。这款被称作"全球最强编程模型"的新品，在真实编程场景测试中力压群雄，同时将AI持续工作时长提升至30小时以上，引发行业高度关注。

在权威编程测试平台SWE-bench Verified的最新评估中，Claude Sonnet 4.5以显著优势登顶榜首。该测试专门考察模型解决实际编程问题的能力，涵盖代码修复、功能扩展等复杂任务。更令人瞩目的是，在模拟真实计算机操作的OSWorld基准测试中，新模型取得61.4%的准确率，较四个月前的前代产品提升近20个百分点，创下该测试历史新高。

这款模型展现出惊人的持续工作能力，可连续30小时保持高效编程状态。对比此前Claude Opus 4和Codex等模型最多7小时的独立工作时间，新模型在耐力方面实现质的飞跃。实测显示，其能一次性完成约1.1万行代码的编写任务，相当于开发一个完整聊天应用的代码量。

技术升级带来显著效率提升。开发者反馈显示，新模型在代码重构任务中表现突出，某次调用中同时完成25次工具调用、新增3000余行代码并生成12个全新文件。虽然生成的模块化代码首次运行存在缺陷，但其架构设计的优雅性获得专业人士认可。Cursor等开发工具平台证实，该模型在处理长周期编程任务时，错误率较前代降低37%。

伴随模型发布，Anthropic同步推出多项开发工具创新。Claude Code新增"检查点"功能，支持开发进度实时保存与回溯；原生VS Code插件实现终端界面全面升级；API服务整合代码执行与文件创建功能，开发者可在对话中直接完成全流程开发。最受关注的是Claude Agent SDK的开放，这套构建智能体的底层框架，解决了记忆管理、权限控制等关键技术难题。

定价策略延续亲民路线，新模型API调用费用与前代持平，每百万tokens收费3至15美元。安全性能方面，通过强化对齐训练，模型在防范欺骗行为、抵制权力诱惑等维度取得突破性进展。测试数据显示，提示注入攻击的防御成功率提升至92%，内容误判率下降至0.7%以下。

市场反应呈现两极分化。部分开发者惊叹于其代码生成效率，称"这是首个能真正参与企业级开发的AI模型"；也有用户指出生成的代码需要较多人工调试。技术社区出现有趣现象：尽管两个月前遭遇"降智"风波导致部分用户流失，但新模型发布后，原Codex用户中出现回流趋势，GitHub相关讨论量周增45%。

竞争格局因新模型发布再度生变。当前Anthropic估值达1830亿美元，年化营收突破50亿美元，其中编程工具贡献超四成收入。面对OpenAI和谷歌Gemini的激烈竞争，公司选择在对手年度开发者大会前夕发布新品，战略意图明显。联合创始人Jared Kaplan透露，更强大的Opus系列模型将于年内推出，暗示大小模型协同发展的技术路线。

创新功能"Imagine with Claude"引发技术圈热议。该临时研究预览仅向高级订阅用户开放五天，其核心突破在于实现软件功能的实时生成与调整。所有界面元素和底层代码均在用户交互过程中动态创建，这种"所见即所建"的开发模式，为AI辅助编程开辟全新路径。技术分析师指出，该功能若能稳定运行，将重新定义人机协作的边界。