Artificial Analysis发布全新Coding Agent基准智谱GLM-5.1取得全球开源SOTA-信息流-ITBear科技资讯

全球权威评测机构Artificial Analysis今日发布全新Coding Agent基准Artificial Analysis Coding Agent Index，用于衡量Agent harnesses与模型的组合在SWE-Bench-Pro-Hard-AA、Terminal-Bench v2和SWE-Atlas-QnA主流基准上的表现。其中，智谱GLM-5.1(在Claude Code中运行)取得开源第一。
Artificial Analysis在官方推文中点明了这一新榜单的“含金量”：“当开发者使用AI编程时，他们不仅在选择模型，也在将其与特定的Agent harness搭配使用。只有对这一组合进行基准测试，才能真正理解并比较不同模型的真实性能。”
从评测结果上来看，GLM-5.1代表了国产大模型在实际编程Agent场景下的SOTA级别能力。

Artificial Analysis发布全新Coding Agent基准 智谱GLM-5.1取得全球开源SOTA

Artificial Analysis发布全新Coding Agent基准智谱GLM-5.1取得全球开源SOTA