ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

Anthropic新推Claude Haiku 4.5:性能媲美顶配,价格亲民,开发应用更高效

时间:2025-10-16 18:09:38来源:快讯编辑:快讯

近日,人工智能领域迎来重要进展——Anthropic公司正式推出新一代轻量级AI模型Claude Haiku 4.5。这款被定位为"小杯"的模型,在性能、速度与成本之间实现了突破性平衡,引发开发者社区广泛关注。

作为Claude系列三款模型中的入门级产品,Haiku 4.5在保持高水准性能的同时,将响应速度提升至前代的两倍以上。实测数据显示,该模型在编码任务中达到73%的准确率,与中杯型号Sonnet 4及OpenAI最新模型GPT-5持平。更令人瞩目的是,其价格仅为Sonnet 4的三分之一,每百万输入token收费1美元,输出token收费5美元。

在SWE-bench Verified编码基准测试中,Haiku 4.5展现出惊人实力。该测试通过模拟真实编程场景评估模型能力,结果显示新模型不仅能高效完成常规任务,在自动化电脑操作等复杂场景中甚至超越了老大哥Sonnet 4。这种表现使其成为实时交互场景的理想选择,无论是智能客服、编程助手还是多智能体协作系统,都能从中获得显著效率提升。

技术架构层面,Haiku 4.5创新性地支持任务拆解功能。开发者可将复杂问题分解为多个子任务,由主模型调度多个Haiku 4.5实例并行处理。这种设计既保持了轻量级模型的灵活性,又通过分布式计算实现了接近旗舰模型的复杂问题处理能力。安全测试显示,其不良行为发生率较前代降低40%,自动化对齐评估中的偏离行为显著少于同系列高端型号。

尽管在数学计算方面存在短板——实测显示其算术能力弱于同类竞品,但在工具调用和自主决策场景中表现优异。知名技术博主Dan Shipper的对比测试表明,该模型在处理Uber账单等复杂任务时,虽在金额计算上偶有失误,但能准确识别并整合多封邮件中的关键信息,这种"重逻辑轻计算"的特性恰好契合特定应用场景需求。

市场定位方面,Haiku 4.5为开发者提供了极具吸引力的选择。与Google Gemini 2.5 Flash和GPT-5 mini相比,其价格虽高出3-4倍,但在复杂任务处理和系统集成方面展现明显优势。对于已部署Sonnet 4.5的应用,可直接替换为Haiku 4.5实现降本增效,性能损失可忽略不计。

商业战略层面,这家估值达1700亿美元的AI新贵正加速生态布局。据内部人士透露,公司计划通过战略收购扩充技术团队,重点拓展代码安全检测、自动化测试等开发者工具领域。潜在收购目标集中在5亿美元以下的小型技术团队,旨在快速补强特定行业解决方案能力,医疗、金融和网络安全领域成为重点方向。

目前,Claude Haiku 4.5已通过Claude API、Amazon Bedrock和Google Cloud Vertex AI全面上线。开发者社区的初步测试显示,该模型在时钟设计等典型应用中,代码生成速度较前代提升35%,成品质量保持稳定。这种"小而强"的特性,正在重塑轻量级AI模型的市场竞争格局。

更多热门内容
英特尔Panther Lake处理器登场:X系列首发,18A工艺引领新篇章
2025年10月15日,英特尔正式发布了代号为PantherLake的全新处理器系列。该系列将搭载性能最强的集成显卡,前三个型号配备12个Xe3 GPU核心,而X5 338H则集成10个Xe3核心。这些处…

2025-10-16

清华团队再创佳绩!全球首款亚埃米级快照光谱成像芯片“玉衡”问世
【太平洋科技】10 月 16 日消息,据科技日报报道,清华大学电子工程系方璐教授团队成功研制出全球首款亚埃米级快照光谱成像芯片“玉衡”。 研究团队创新提出“可重构计算光学成像”架构,通过光子调制与计算重建…

2025-10-16

从AI Phone到Robot Phone:荣耀Magic8系列AI智能体如何开启交互新革命?
全新MagicOS 10 系统正是基于这一理念打造的,区别于市场上其他品牌的 AI 功能堆砌,荣耀 YOYO 的“自进化”能力,是可以带来越用越懂你、无需手动设置、会“悄悄练级”、不断学习你的习惯的智慧体验…

2025-10-16

苹果全新M5处理器发布:AI性能飞跃,图形与CPU性能双双跃升
尽管核心数量没有变化,但苹果表示,这些M5的CPU的多线程性能相比M4提高了15%。 在GPU方面,M5配备了10核GPU,相比M4在图形性能上提高了30%,而且其每个GPU内核当中都嵌入了一个神经加速器,使…

2025-10-16

小米与北大联合发文!“天才少女”罗福莉参与,提出MoE模型新解法
R3的主要思路是在训练前向传播过程中重用推理路由掩码I,同时仍将softmax应用于训练逻辑以保持梯度流。 为了证明R3在缩小训练-推理差异上的有效性,研究人员使用Qwen3-30B-A3B模型进行了验证,…

2025-10-16

荣耀Magic8系列登场:AI赋能影像升级,性能跃升开启自进化新篇
此外,本场发布会还带来多款荣耀全场景新品,其中荣耀MagicPad3Pro是全球首款第五代骁龙®8至尊版平板,支持至多20个窗口同时运行;荣耀MagicPad3 12.5支持荣耀类纸柔光屏,新增“放青松”…

2025-10-16

苹果iPhone 18 Pro系列将首用可变光圈,国内企业助力核心部件供应
【环球网科技综合报道】10月16日消息,据Wccftech报道,苹果公司计划在2025年秋季发布的iPhone 18 Pro系列手机中,首次引入可变光圈镜头技术。该技术可根据拍摄环境灵活调整真实景深,为用户带…

2025-10-16

OPPO ColorOS 16深度剖析:流畅升级与AI战略双轨驱动新体验
2025 年 10 月 15 日,OPPO 开发者大会「ODC25」在深圳正式开幕,雷科技也受邀参加了此次开发者大会与随后的 OPPO AI峰会。 在雷科技看来,要实现 OPPO 所描绘的「全场景、全链路…

2025-10-16

荣耀Magic8 Pro深度体验:AI赋能,开启手机自进化新篇章
此外,芯片所搭载的Hexagon NPU AI,这一次也是提升了算力,能够支持终端侧多模态生成式AI,荣耀Magic8Pro这一次在AI能力上的提升,也成为了可能了。 说完荣耀Magic8 Pro在性能、…

2025-10-16

中国科学家破解固态电池难题:三大技术突破助力100kg电池续航迈向1000公里
IT之家从报道中获悉,为此我国多个科研团队纷纷出手,三大关键技术突破让“陶瓷板”和“橡皮泥”实现严丝合缝,有望解决固固界面的接触难题,彻底打通固态电池的续航瓶颈。在电池工作时,碘离子像“交通警察”一样,顺着…

2025-10-16