ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

阿里通义Qwen3-VL-Embedding与Reranker模型发布开源 助力多模态信息高效检索理解

时间:2026-01-09 05:01:29来源:ITBEAR编辑:快讯

通义大模型团队宣布,正式开源两款面向多模态检索场景的模型——Qwen3-VL-Embedding与Qwen3-VL-Reranker。这两款模型以Qwen3-VL为基础架构,通过统一框架实现文本、图像、可视化文档及视频等模态的协同处理,为混合内容理解与检索提供端到端解决方案。目前,模型代码与权重已通过GitHub平台开放下载。

在技术实现层面,Qwen3-VL-Embedding采用双塔独立编码架构,通过将不同模态数据映射至共享语义空间,生成具备跨模态对齐能力的向量表示。该模型支持单模态或混合模态输入,通过提取基座模型[EOS] token的隐藏状态向量,实现高效的大规模检索编码。实验数据显示,8B参数版本在MMEB-v2基准测试中超越所有开源及闭源模型,在MMTEB多语言评测中亦展现出与纯文本模型相当的性能竞争力。

作为检索流程的精细化组件,Qwen3-VL-Reranker采用单塔交叉注意力架构,通过联合编码查询-文档对实现深层语义交互。该模型通过预测"yes/no"特殊token的生成概率输出相关性分数,在视觉文档检索等任务中较基线模型提升显著。测试表明,8B版本在JinaVDR、ViDoRe v3等数据集上均达到最佳性能,其架构设计有效解决了传统重排序模型跨模态交互不足的痛点。

模型设计团队特别强调其工程实用性:通过动态向量维度调整、任务指令微调等机制,开发者可灵活适配不同业务场景;量化压缩技术使模型在保持精度的同时减少存储开销;多语言支持覆盖30余种语言,满足全球化部署需求。在MMEB-v2、MMTEB等权威评测中,该系列模型在图文检索、视频-文本匹配等12项子任务中均取得领先成绩,验证了其技术架构的普适性。

目前,开发者可通过GitHub仓库(https://github.com/QwenLM/Qwen3-VL-Embedding)获取完整模型代码及训练配置。团队同步释放了模型权重文件与推理示例,支持PyTorch框架下的快速部署。此次开源标志着多模态检索技术进入模块化发展阶段,为智能搜索、内容推荐等应用场景提供新的技术路径。

更多热门内容
OPPO阔折叠新机或登场?大折叠已就绪,折叠屏市场将迎新竞争格局
另外,同一位博主在去年的爆料中提到过,OPPO、vivo、小米、华为、荣耀都会迭代大折叠,大部分还是先上常规比例,大概年中往后陆续上“阔折叠”,预计会有3台,竞对iPhoneFold。 也就是说,今年的折…

2026-01-09

一加Turbo6 1月9日开售!9000mAh大电池+165Hz屏,2099元起游戏党新选择
一加Turbo6搭载第四代骁龙8s风驰版,这颗芯片出厂写入风驰游戏内核,搭配LPDDR5X和UFS4.1,安兔兔综合性能跑分达到了260.9万+。 亓言纪语:对于一加Turbo6,亓纪的想法是这样的:该机的…

2026-01-09

小米REDMI Turbo 5 Max本月登场,定位超Pro,2.5K档性能之战一触即发
IT之家 1 月 8 日消息,小米 REDMI 产品经理胡馨心今日发布视频,简单剧透了 REDMI Turbo 5系列,新机号称“正牌真香机”,已官宣本月见。 胡馨心透露,REDMI Turbo 5 系列手…

2026-01-09

阿里云发布多模态开发套件,硬件软件双管齐下,AI手机布局再提速
阿里云通义大模型业务总经理徐栋在接受时代财经等采访时表示,该多模态交互开发套件的核心是为开发者一站式降低门槛,具备四大特点:一是集成丰富模板,支持拖拉拽开发及自有SDK接入,大幅降低开发门槛;二是将按Tok…

2026-01-09

2026年去水印工具大测评!6款热门工具深度实测,帮你精准避坑选好货!
这款工具之所以能够脱颖而出,是因为它在处理速度上堪称一绝,极速处理让你无需漫长等待;隐私安全方面做到了极致,让你的数据毫无泄露风险;永久免费的承诺更是诚意满满,没有任何套路;全平台支持让你在各个主流平台都能畅…

2026-01-09