阿里Qwen3.7-Max模型在Code Arena编程榜居第二，Design Arena亦获佳绩-业界动态-ITBear科技资讯

全球人工智能领域权威编程评测榜单Code Arena近日完成更新，阿里巴巴自主研发的旗舰大模型Qwen3.7-Max以1541分的成绩跻身全球前列。该模型在编程能力评估中位列全球第四，仅次于Claude系列的三款模型，在大模型厂商中稳居第二把交椅。

作为人工智能领域最具公信力的编程能力评估平台，Code Arena的评测体系突破传统学术测试框架，重点考察模型处理复杂代码生成、调试与重构任务的实际能力。为确保评测结果的真实性，平台采用用户随机盲测机制，模型需在未知考题的情况下即时完成编程任务，有效杜绝了数据泄露与针对性优化等作弊行为。

在最新公布的榜单中，Qwen3.7-Max不仅超越了Claude-opus-4-6模型，更在综合实力上领先GLM-5.1、Kimi-k2.6等知名模型。评测数据显示，该模型在代码逻辑严谨性、功能实现完整度等核心指标上表现突出，展现出处理工业级编程任务的强大潜力。

值得关注的是，阿里巴巴在AI模型评测领域持续取得突破。在同期发布的Design Arena榜单中，Qwen3.7-Max同样表现优异，位列全球第十。这个被业界誉为"AI奥林匹克"的评测平台，通过真实用户盲测机制对模型进行多维评估，其结果被广泛视为衡量AI模型综合实力的重要标准。

Design Arena及其衍生评测体系（包括图像侧的Image Arena/LMArena）构建了覆盖代码生成、视觉理解等多领域的评估框架。该平台通过动态更新的测试用例库和严格的防作弊机制，确保评测结果能够真实反映模型在真实应用场景中的表现，其权威性得到全球AI研究机构的广泛认可。