ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

重磅!阿里推出Qwen2-VL-72B视觉模型,长视频理解力破20分钟大关!

时间:2024-08-31 15:49:42来源:ITBEAR编辑:快讯

【ITBEAR】8月31日消息,阿里通义千问近日发布了其第二代视觉语言模型Qwen2-VL,标志着人工智能领域的一大进步。该模型的旗舰版Qwen2-VL-72B已经正式上线阿里云百炼平台,供广大开发者和企业应用。

据ITBEAR了解,Qwen2-VL在多模态模型领域取得了显著成就,甚至在多个权威测评中超越了GPT-4o和Claude3.5-Sonnet等知名闭源模型。特别是在文档理解方面,Qwen2-VL展现出了明显的优势,显示出强大的多模态理解能力。

该模型的出色表现不仅体现在静态图像的理解上,它还能理解20分钟以上的长视频,并支持基于视频的问答、对话和内容创作等多种应用。这一功能将极大地丰富视觉语言模型在实际场景中的应用范围。

此外,Qwen2-VL还具备视觉智能体能力,可以集成到手机、机器人等设备中,根据视觉环境和文字指令进行自动操作。这一特点使得该模型在未来的智能设备领域具有广阔的应用前景。

值得一提的是,Qwen2-VL还能理解图像视频中的多语言文本,包括中文、英文、大多数欧洲语言、日语、韩语、阿拉伯语和越南语等,这为其在国际化的应用场景中提供了更多可能性。

阿里通义千问团队从多个方面对模型能力进行了全面评估,结果显示Qwen2-VL-72B在大部分指标上都达到了行业最优水平。用户现在即可通过阿里云百炼平台轻松调用Qwen2-VL-72B的API,体验其强大的视觉语言处理能力。

更多热门内容
华为花瓣地图Agent来袭:智能语音交互,轻松规划行程开启趣味旅行
不管是想找能看海又能喝下午茶的小店,还是寻找适合休闲散心的去处,它都能精准匹配地点,还会讲清楚推荐的理由,不用我们再一个个筛选对比。像“和闺蜜川西五日游,行程轻松、适合拍照,想看雪山与大熊猫”这类个性化需求…

2026-06-14

REDMI K100系列爆料来袭:万级大电池加持 骁龙8E5芯片平衡性能与成本
PChome 6月13日消息,据爆料人士透露,REDMIK100系列将在续航规格上迎来重大突破,全系有望配备10000mAh级别超大容量电池,这一配置将彻底改变用户的续航焦虑,实现"告别充电宝" 的使用体…

2026-06-14

三星首款“阔折叠”手机UTG玻璃盖板厚度增至60μm 抗冲击力或提升
IT之家 6 月 13 日消息,据韩媒 ZDNET Korea 当地时间昨日消息,三星电子已将其预计 2026H2推出的首款“阔折叠”形态智能手机的 OLED 屏幕 UTG 玻璃盖板厚度从此前尝试的 30μ…

2026-06-14

荣耀Robot Phone亮相上海电影节:以创新科技重塑移动影像创作新体验
【CNMO新闻】6月13日,荣耀RobotPhone亮相第28届上海国际电影节并完成专业影像首秀。作为行业首款阿莱ARRI电影级画质与色彩的移动影像设备,荣耀Robot Phone搭载行业最小钛合金云台,实…

2026-06-14

荣耀Robot Phone闪耀上海国际电影节,以创新科技引领移动影像新潮流
6月13日,荣耀RobotPhone亮相第28届上海国际电影节并完成专业影像首秀。作为行业首款阿莱ARRI电影级画质与色彩的移动影像设备,荣耀Robot Phone搭载行业最小钛合金云台,实现了超精密、超…

2026-06-14