ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

中文多模态测评新突破:豆包登顶,国产视觉语言模型展现强劲实力

时间:2026-04-29 12:05:27来源:互联网编辑:快讯

在最新发布的SuperCLUE-VLM中文多模态视觉语言模型测评中,国内人工智能领域迎来里程碑式进展。字节跳动研发的Doubao-Seed-2.0-Pro-260215模型以90.66分的绝对优势登顶总榜,较谷歌Gemini-3.1-Pro-Preview的89.35分高出1.31分,成为首个在该权威测评中超越国际顶尖水平的国产模型。

本次测评覆盖全球17款主流视觉语言模型,国产力量展现强劲竞争力。除字节跳动外,阿里巴巴Qwen3.5系列、商汤科技SenseNova及智谱AI的GLM等模型均跻身前列,形成与海外模型分庭抗礼的格局。值得注意的是,OpenAI的GPT-5.4等国际知名模型仅位列中游,印证了中国在多模态技术领域的快速崛起。

测评体系包含基础认知、视觉推理、视觉应用三大维度,下设通用识别、医疗影像分析等25项细分任务。国产模型在基础认知领域表现尤为亮眼,平均得分突破90分大关,展现出对复杂语义和视觉信息的精准解析能力。数据分析任务中,多个模型实现近乎满分的表现,证明其在结构化信息处理方面的成熟度。

尽管整体成绩斐然,测评结果也暴露出技术短板。在涉及工业检测、医学影像诊断等专业场景时,国内模型得分普遍低于基础认知任务10-15个百分点。特别是在需要跨模态逻辑推理的复杂任务中,部分模型出现理解偏差,反映出从感知智能到认知智能的跨越仍需突破关键技术瓶颈。

核心亮点速递:Doubao-Seed-2.0-Pro-260215创下测评历史最高分;国产模型包揽基础认知类任务前三甲;医疗影像分析任务中,最高分模型仍存在12%的误判率;工业质检场景下,国际模型平均得分反超国内模型8.3个百分点。

更多热门内容
家电ETF易方达(159328)午间收跌2.55% 成交额128.28万 重仓股多数飘绿
来源:新浪基金∞工作室 5月28日,截止午间收盘,家电ETF易方达(159328)跌2.55%,报1.070元,成交额128.28万元。家电ETF易方达(159328)重仓股方面,美的集团截止午盘跌1.29%…

2026-05-28

神舟二十三号乘组挑战一年期驻留 新实验助力中国航天迈向深空
神舟二十一号乘组太空出差7个月,刷新了中国航天员乘组在轨驻留最长纪录,而前来接班的神舟二十三号乘组中,有一名航天员将向一年期在轨驻留发起挑战。二是将验证航天员长期飞行健康保障能力,完善在轨医疗与防护体系; …

2026-05-28