ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

Qwen3-Embedding系列模型发布:通义千问引领文本表征与排序新潮流

时间:2025-06-06 09:20:53来源:ITBEAR编辑:快讯团队

通义千问团队近期揭晓了其Qwen模型家族的新力作——Qwen3-Embedding系列模型,该系列专为文本表征、检索与排序等任务精心打造。基于Qwen3基础模型的深厚底蕴,新系列充分沿袭了其在多语言文本理解上的卓越能力。

在各项基准测试中,Qwen3-Embedding系列模型表现非凡,特别是在文本表征和排序任务上大放异彩。通过MTEB(包括英文版v2、中文版v1、多语言版及代码版)检索数据集的测试,该系列中的0.6B参数规模模型在top-100向量召回结果中展现出色。尤为8B参数规模的Embedding模型在多语言榜单上独占鳌头,以70.58的高分超越了众多商业API服务。

Qwen3-Embedding系列提供了三种不同参数规模的模型配置,从0.6B到8B,以满足多样化的性能与效率需求。开发者可以根据实际场景灵活组合表征与排序模块,实现功能的灵活扩展。该系列模型还支持表征维度的自定义和指令适配优化,用户可以根据具体任务、语言或场景需求,调整表征维度并自定义指令模板,从而优化性能。

在多语言支持方面,Qwen3-Embedding系列同样表现出色,覆盖超过100种语言,包括主流自然语言及多种编程语言,具备强大的多语言、跨语言及代码检索能力。该系列模型采用双塔结构和单塔结构设计,分别应用于Embedding模型和Reranker模型,通过LoRA微调技术,最大限度地保留了基础模型的文本理解能力。

训练过程中,Qwen3-Embedding系列采用了多阶段训练范式,并针对具体应用场景进行了深度优化。Embedding模型历经三阶段训练,包括基于超大规模弱监督数据的对比学习预训练、高质量标注数据的监督训练以及模型融合策略,实现了泛化能力与任务适配性的良好平衡。而Reranker模型则直接采用高质量标注数据进行监督训练,以提高训练效率。

目前,Qwen3-Embedding系列模型已在Hugging Face、ModelScope和GitHub平台开源,用户还可以直接使用阿里云百炼平台提供的最新文本向量模型服务。这一发布标志着通义千问在文本表征与排序领域迈出了重要一步,未来,随着Qwen基础模型的持续优化,该团队将继续提升训练效率,并计划拓展多模态表征体系,构建跨模态语义理解能力。

用户可以通过以下链接获取Qwen3-Embedding系列模型的相关信息:

ModelScope: https://modelscope.cn/collections/Qwen3-Embedding-3edc3762d50f48

ModelScope: https://modelscope.cn/collections/Qwen3-Reranker-6316e71b146c4f

Hugging Face: https://huggingface.co/collections/Qwen/qwen3-embedding-6841b2055b99c44d9a4c371f

Hugging Face: https://huggingface.co/collections/Qwen/qwen3-reranker-6841b22d0192d7ade9cdefea

GitHub: https://github.com/QwenLM/Qwen3-Embedding

更多热门内容
印尼网约车市场风云:差异化竞争下的生存智慧与增长潜力
相较于格局稳定的中国网约车市场,在印尼Grab、Gojek、Blue Bird、Maxim 四家公司仍在激烈争夺市场。分城市看,印尼超过70%的网约车交易发生在大雅加达地区,但就算是雅加达,大部分时间网约车…

2025-06-06

永辉胖改首店一周年:热度褪去,调改之路何去何从?
当然,或许是因为实地探访的时间(工作日午后)并非购物高峰期,笔者又辗转到距离瀚海海尚店不到三公里的信万广场店,作为郑州胖改第一店,这里客流明显提升不少,每一处货架几乎都有顾客在挑选商品,熟食区聚集了十余名顾…

2025-06-06

卫浴龙头帝欧家居控制权生变,市值缩水百亿能否迎来新转机?
而据当时帝欧家居披露的《简式权益变动报告书》显示,本次权益变动主要是基于看好上市公司未来发展前景及四川资本市场纾困基金作为纾困基金的战略定位,双方为共同推动帝欧家居快速发展,深化务实合作、拓宽合作领域,进行…

2025-06-06