ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

全球AI Lab前十!Agnes新模型发布,以全模态+超低价定义模型性价比

时间:2026-05-12 19:50:01来源:硅星人Pro编辑:快讯

如果说过去一年,全球 AI 行业的关注点还集中在OpenAI、Google、Anthropic、meta 与 DeepSeek等头部公司,那么Agnes的连续上榜,则意味着全球 AI 竞争格局正在出现新的变量。

近日,Agnes AI旗下模型Agnes-2.0-Flash与Agnes-Image-2.0-Flash同时进入国际权威榜单前列,从PinchBench全球前十,到如今Claweval与Artificial Analysis双榜持续上榜,Agnes已连续获得多个国际评测体系认可,并正式进入“全球AI Lab排名第9”的位置。

目前Agnes的模型能力与Harness系统已经开始服务数千万规模用户,已经被广泛应用于AI内容生成、自动化工作流、网页操作、多模态创作以及开发者工具等场景。

1

AI 行业,正在出现新的全球玩家

本次Agnes-2.0-Flash上榜的Claw-eval(https://claw-eval.github.io),并不是传统意义上的“刷题榜”。

相比过去主要测试数学、知识问答或者代码能力的Benchmark,Claw-eval更强调模型在真实Agent场景中的综合执行能力,被不少开发者视为当前“更接近AI Agent实战能力”的重要评测体系之一。

随着AI行业从Chatbot阶段进入Agent阶段,行业对于模型的要求,已经不再只是“会回答问题”,而是“能否真正完成任务”,这也是为什么越来越多开发者开始关注Claw-eval这类真实任务导向型榜单。

而此次Agnes-2.0-Flash在部分任务中超越Gemini Flash与 MiniMax M2.7等知名模型。这意味着Agnes已经开始具备进入全球模型第一梯队竞争的能力。

除了文本模型外,Agnes在图像编辑方向同样取得突破。

本次Agnes-Image-2.0-Flash进入的 Artificial Analysis是当前国际AI行业关注度较高的第三方模型评测体系之一,也表明Agnes在图像编辑方向已经达到国际主流水平。

尤其在海外AI圈,Artificial Analysis已经逐渐成为衡量模型综合能力的重要观察窗口。

更值得注意的是,Agnes本次上榜的并不是超大参数模型,而是轻量级高效率模型。在更低推理成本、更低GPU消耗情况下依然进入全球前列,这也是近期全球开发者社区开始重新关注Agnes的重要原因。

1

比性能更激进的,是Agnes的价格策略

相比榜单成绩,更让行业关注的,其实是Agnes的定价。

目前,Agnes-2.0-Flash的官方API定价为每百万输入tokens 0.03美元,每百万输出tokens 0.15美元,成本已经低于大多数主流模型。据公开信息显示,其价格已经低于国际与国内头部模型产品,仅为 DeepSeek V4 Flash的约一半。

而在图像模型方向,Agnes同样展现出了极强的价格竞争力。

目前,Agnes-Image-2.0-Flash的价格仅为3美元/1000张图片,而当前行业主流模型的平均价格普遍在30美元/1000张图片左右,在保持高质量图像生成与编辑能力的同时,Agnes的成本仅约为行业平均水平的十分之一。

Agnes的出现,并没有选择简单地“堆参数”,而是更强调:

1.推理效率优化

2.Agent场景适配

3.多模型协同

4.更低成本部署

5.更高性价比输出

这种路径,也让Agnes在当前AI行业“推理成本大战”中,形成了明显差异化。

尤其对于开发者而言,这意味着他们第一次有机会,以远低于行业平均水平的成本,大规模调用第一梯队AI模型能力。

当行业还在讨论谁拥有最强模型时,Agnes已经开始推动另一件更关键的事情——让全球开发者第一次有机会,以更低成本、更高效率,大规模使用真正具备Agent能力的AI模型。

这或许也意味着,全球 AI 行业正在迎来一个新的竞争阶段——不仅比拼模型能力,也开始真正比拼效率、成本与大规模落地能力。

更多热门内容
185米长征九号:以独特设计逻辑,在地月空间走出专属航天之路
把长征九号说成中国版星舰,就像说潜艇是水下版驱逐舰,外形上都像船,但干的事完全不同。这个闭环能力是星舰存在的理由,没有它,星舰不过是一枚很大的火箭而已。星舰用不锈钢是权衡之后的结果,但长征九号的第一优先级是运…

2026-06-09

Prada跨界航天:为NASA登月任务设计内层太空服,拓展品牌新边界
随着NASA Artemis计划推进,人类未来将在月球南极开展长期探索任务,相比阿波罗时代,月球南极环境更加极端,局部区域温差可达到数百摄氏度,对宇航服的隔热、散热和灵活性提出更高要求,Prada在高性能材…

2026-06-09

商业航天进程加速,低轨卫星组网频发,Computex新品引领科技新动向
6月9日,中信建投研报指出,千帆星座一周三次组网发射,在轨卫星达到200颗。6月文昌计划5次发射任务,近期多款民营火箭首飞在即,火箭供给端逐步丰富叠加发射服务保障能力完善,商业航天产业进程有望加速。Spac…

2026-06-09

马斯克用人逻辑:打破经验枷锁,让年轻人与创新为航天业注入新活力
马斯克经常说,不要拿别人已经做过的事情当真理,你要从物理学定律出发,重新推导一切,比如火箭的外壳材料,传统上用昂贵的碳纤维或者铝合金。 因为年轻人还没有被行业惯例驯化,他们更愿意问为什么不,而不是说一直就这…

2026-06-09

马斯克揭秘SpaceX轨道AI卫星计划:技术成熟,明年量产布局太空算力
马斯克与 SpaceX 工程师伊恩 · 达尔介绍了 AI 卫星方案:这类卫星将在轨充当计算节点,依靠太阳能供电,并通过向太空散发热量实现散热。马斯克在视频中表示:“AI 卫星本质上就是大量太阳能电池、一个…

2026-06-09