Anthropic全新发布Claude Sonnet 5：性能直逼Opus 4.8，成本优势成亮点-业界动态-ITBear科技资讯

Anthropic 正式推出全新人工智能模型 Claude Sonnet 5，这款模型被描述为"迄今为止最具自主智能体特性的 Sonnet 版本"。新模型在制定计划、使用浏览器和终端等工具方面展现出显著进步，其自主运行能力已达到数月前只有更大规模、更高成本模型才能实现的水平。

性能测试显示，Sonnet 5 在推理、工具使用、编程和知识工作等核心领域较前代4.6版本有显著提升，性能表现接近高端Opus 4.8模型但定价更具竞争力。官方公布的智能体搜索评测（BrowseComp）和计算机使用评测（OSWorld-Verified）数据显示，新模型在中等努力程度下展现出更高的成本效率，高努力程度任务中甚至可媲美Opus 4.8的表现。

定价策略方面，即日起至2026年8月31日期间，输入价格降至2美元/百万token，输出价格为10美元/百万token。恢复标准定价后，输入输出价格将分别为3美元和15美元/百万token。值得注意的是，新模型采用全新tokenizer优化文本处理，相同内容生成的token数量增加约1.0-1.35倍，但官方通过定价调整确保用户过渡成本基本持平。

安全评估显示，Sonnet 5在拒绝恶意请求和抵御提示注入攻击方面表现优于前代，幻觉率和谄媚行为发生率均有所降低。自动化行为审计表明，其失当行为率较Sonnet 4.6下降，但仍高于Mythos Preview和Opus 4.8。在网络安全专项测试中，该模型未能开发出完整的Firefox浏览器漏洞利用程序，部分成功率略高于前代但显著低于Opus 4.8和Mythos 5。

开发者反馈显示，新模型在浏览器使用场景中表现突出，提示注入攻击成功率仅0.93%，远低于Opus 4.8的31.5%和Sonnet 4.6的50.7%。但成本分析指出，Sonnet 5在Intelligence Index上的运行成本达每任务2.29美元，较前代增加约2倍，较Opus 4.8高出15%，成为运行成本最高的模型之一。

技术调整方面，Anthropic同步上调了Chat、Cowork、Claude Code等平台的速率限制，以适应高努力程度模式带来的token消耗增加。网络安全验证计划已覆盖Claude原生平台、AWS、Microsoft Foundry等主要部署环境，Google Vertex平台支持即将上线。对于需要更高安全权限的网络安全工作，官方仍推荐使用Opus 4.8模型。

评测数据更正说明显示，Humanity’s Last Exam评分模型更新后，Sonnet 4.6无工具/有工具分数修正为34.6%和46.8%；OSWorld-Verified评测优化后，前代分数修正为78.5%。这些调整解释了与早期发布数据的差异。目前开发者社区正持续测试新模型，用户可通过官方渠道获取详细系统卡和评测报告。

手机厂商入局AI眼镜：是寻找新增长，还是应对生态挑战的保卫战？

增长速度放缓，智能手机的生态保卫战手机厂商探索AI眼镜的背后，一个核心因素在于手机在过去二三十年的时间里，已经发展成为了公认的计算平台，衣食住行娱乐所有产生的需求服务都可以在对应的APP上解决。无论是华…

2026-07-01

Claude Science重塑科研模式：将两年综述撰写压缩至几周，开启可审计工作流时代

【新智元导读】这一回，Anthropic没有推更聪明的科研模型，而是动了科研的根：第一次把科研拆成了一条能被逐步审计的流水线。 Claude Science顺着这一点，在出图、出稿的同时，把生成它们的代码一…

2026-07-01

瑞银调研：六成企业收紧AI开支，开源模型或成企业降本新选择

团队在报告中写道：“绝大多数企业都将词元调用成本优化列为核心工作，这直接导致部分企业大幅放缓人工智能投入增速；但还有两类企业受到的影响相对有限：一类人工智能落地尚处于早期阶段，另一类虽已深度布局AI 业务…

2026-07-01

小米集团“小米辟谣”官微上线搭建权威渠道共筑清朗网络环境

6月30日，小米集团宣布，其官方辟谣阵地“小米辟谣”在中央网信办违法和不良信息举报中心的指导下正式上线，并同步开通了官方微博账号。 “小米辟谣”官方微博在首条动态中表示，感谢社会各界和广大米粉长期以来对小米集…

2026-07-01

Anthropic全新发布Claude Sonnet 5：性能直逼Opus 4.8 成本优化有新招

这些护栏 —— 能够实时检测并阻止危险的网络使用 —— 与 Claude Opus 4.7 和 4.8 中的相同（因为 Anthropic 判断Sonnet 5 的整体网络安全风险较低，其护栏严格程度低于 …

2026-07-01

苹果iOS26.6beta3初体验：续航信号双提升，果粉反馈优化显著值得升级

苹果凌晨突然发布了iOS26.6beta3系统更新，这个版本就是上个版本的修复版，主要用于完善当前系统的稳定性和一些其他优化，那么大家最关心的还是各种性能优化，下面就给大家分享首批果粉熬夜升级iOS26.6b…

2026-07-01

小米首款智能存储1小时售罄，2299元定价亲民成市场“黑马”

在当下存储大涨价的背景下，这个价格基本等于是买硬盘送NAS了，那性价比就相当无敌了。AI军备竞赛导致存储产品疯狂涨价，相比内存和固态硬盘，机械硬盘受到的影响已经比较小了，但涨幅还是达到了40%左右。当然，小米…

2026-07-01

时隔四年再调整！字节跳动聚焦AI时代，更新领导力原则谋新篇

6月29日晚间，字节跳动CEO梁汝波向全体员工发送内部邮件，宣布重新梳理并更新公司的文化内容。值得一提的是，就在此前的6月23日，在“2026火山引擎FORCE原动力大会”上，梁汝波通过视频演讲首次对外公…

2026-07-01

对话亚马逊云科技高管：洞察其全球技术本土化同步与AI创新新路径

凭借二十余年全球云计算技术的积累，亚马逊云科技在大模型生态、底层算力基础设施、AI数据库架构、分层服务定价等多个维度，已经形成了自己的独特优势，G2与王晓野在此次沟通中也全方位拆解了这套全栈技术壁垒与服务逻…

2026-07-01

浙江通服携手阿里云：共拓AI合作新篇，在多领域展开深度协同发展

7月1日，据阿里云消息，近日，浙江省通信服务控股集团有限公司与阿里云签署AI战略合作协议，双方将围绕大模型Token运营、智算中心建设、算电协同、行业应用、海外市场拓展等方向开展合作。在行业应用方面，双方…

2026-07-01