ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

编程与智能体开发新突破:Claude Sonnet 4.5携多项升级登场

时间:2025-10-01 04:03:20来源:快讯编辑:快讯

人工智能领域迎来重要进展,Anthropic公司正式推出新一代AI模型Claude Sonnet 4.5。该模型在编程能力、计算机操作效率等关键指标上表现突出,特别是在处理复杂多步骤任务时展现出持续专注能力,可连续工作超过30小时。

在编程能力评测中,Claude Sonnet 4.5在SWE-bench Verified测试中位居榜首,其真实编程表现获得专业认可。计算机操作能力评估方面,该模型在OSWorld基准测试中取得61.4%的得分率,较四个月前的版本提升近20个百分点。实际演示显示,模型可直接在浏览器环境中完成网站导航、表单填写等全流程自动化操作。

定价策略方面,新模型保持与前代相同的收费标准:每百万输入token收费3美元(约21.4元人民币),输出token收费15美元(约106.8元人民币)。这一稳定的价格体系为开发者提供了可预期的成本控制。

开发工具链迎来重大升级。Claude Code新增检查点功能,支持自动保存工作进度和即时回滚操作。用户通过双击Esc键或输入/rewind命令,即可快速恢复至历史版本。该功能特别适用于复杂代码修改场景,可单独恢复代码、对话记录或两者组合。

终端界面优化带来更好的可视化体验,新增可搜索的指令历史功能。原生VS Code扩展插件的推出,使开发者能在集成开发环境中直接调用Claude Code,通过专属侧边栏和行内差异对比功能,实时监控代码变更过程。

针对企业级开发需求,Claude Agent SDK(原Claude Code SDK)正式开放。该工具包提供核心架构支持,包含情境管理系统和权限框架,新增子智能体与钩子函数支持。开发者可基于这些组件构建定制化智能体流程,适配特定业务场景。

情境管理能力实现突破性进展。新推出的情境编辑功能可自动清理过期工具调用记录,在保持对话连贯性的同时优化token使用效率。记忆工具则构建了基于文件的外部存储系统,允许智能体在多次对话间持续积累知识库,支持跨会话状态维护。

性能测试数据显示,情境管理与记忆工具的协同使用可使复杂任务处理效率提升39%,token消耗降低84%。在100轮网络搜索测试中,情境编辑功能成功完成原本因情境耗尽而失败的任务,展现出显著的技术优势。

专业领域评估证实,新模型在法律、金融、医学等垂直领域的知识掌握和推理能力均有显著提升。安全训练的强化使模型行为模式得到改善,有效减少了谄媚、欺骗等不良倾向。自动化行为审计显示,其总体行为失当评分较前代明显降低。

更多热门内容
高通骁龙8 Gen6系列将用台积电2nm工艺 终端旗舰价格或迎新变动
快科技9月29日消息,博主数码闲聊站爆料,明年的高通骁龙8 Gen6(SM8950)和骁龙8 EliteGen6(SM8975)全面升级2nm工艺,定位更高,这将是高通首款2nm手机芯片。 据爆料,骁龙8 …

2025-10-01

苹果华为eSIM超薄手机狭路相逢:华为或携麒麟9030芯片抢先突围
据博主“智慧皮卡丘”透露,华为新机不仅将采用eSIM技术,还可能首发全新的麒麟9030芯片,在轻薄与性能上实现平衡。 编辑点评:苹果与华为在eSIM超薄机型上的“正面交锋”,不仅是工业设计和硬件性能的比拼,更…

2025-10-01

荣耀全球首家阿尔法旗舰店启幕,打造开放AI生态,开启智慧生活新篇
IT之家 9 月 30 日消息,荣耀全球首家阿尔法旗舰店今日正式开业(地点:深圳湾万象城 D 区),官方表示这里将成为完全开放的 AI生态平台,汇聚全球最新的 AI 灵感。 IT之家注意到,荣耀终端股份有限…

2025-10-01

降噪耳机怎么选?十款热门降噪耳机大比拼,哪款才是你的出行好搭子
作为拥有十余年音频技术积淀的品牌,西圣这次在A1身上几乎把百元耳机能做到的音质极限拉满,直接下放了千元级旗舰耳机才使用的AeroSilk™钛晶复合振膜,还搭载10mm双声环聚能声音单元+ 旗舰级N48钕磁…

2025-10-01

抖音旗下火山引擎全资设立深圳深空引擎科技公司 注册资本达千万
天眼查工商信息显示,近日,深圳坪山深空引擎科技有限公司成立,法定代表人为陈恺豪,注册资本1000万人民币,经营范围含计算机系统服务、数据处理服务、社会经济咨询服务、企业管理咨询、组织文化艺术交流活动、计算机软…

2025-10-01

苹果iOS26.0.1与iOS18.7.1怎么选?不同机型升级指南助你决策
苹果今天凌晨发布了iOS双系统更新,分别是iOS26.0.1和iOS18.7.1,这次是小版本更新,苹果官方表示修复了很多错误bug,同时带来了一些性能优化,后台有很多小伙伴都在问iOS26.0.1和iOS1…

2025-10-01

​科创AIETF鹏华(589090)涨1.58%,OpenAI开发者大会将启,AI板块迎新契机​
截至2025年9月30日 10:31,上证科创板人工智能指数(950180)强势上涨1.94%,成分股合合信息(688615)上涨7.51%,澜起科技(688008)上涨6.30%,云天励飞(688343)…

2025-10-01

国证机器人指数飘红,宇树科技算法升级,1.8米人形机器人下半年将亮相
来源:界面新闻 截至2025年9月30日 10:11,国证机器人产业指数(980022)上涨0.74%,成分股富临精工(300432)上涨19.98%,航天智装(300455)上涨3.53%,凌云光(6884…

2025-10-01