1月27日凌晨,阿里云通义重磅开源支持100万Tokens上下文的Qwen2.5-1M模型,推出7B及14B两个尺寸,均在处理长文本任务中稳定超越GPT-4o-mini;同时开源推理框架,在处理百万级别长文本输入时可实现近7倍的提速。

百万Tokens长文本,可换算成10本长篇小说、150小时演讲稿或3万行代码。两个月前, Qwen2.5-Turbo
升级了百万Tokens的上下文输入能力,广受开发者和企业欢迎。如今,开源社区可基于全新的 Qwen2.5-1M
系列模型,进行长篇小说或多篇学术论文的解析,或是探索仓库级代码的分析和升级。

Qwen2.5-1M拥有优异的长文本处理能力。在上下文长度为100万 Tokens 的大海捞针(Passkey
Retrieval)任务中,Qwen2.5-1M 能够准确地从 1M
长度的文档中检索出隐藏信息,仅有7B模型出现了少量错误。在RULER、LV-eval等基准对复杂长上下文理解任务测试中,Qwen2.5-14B-Instruct-1M
模型不仅击败了自家闭源模型 Qwen2.5-Turbo,还稳定超越 GPT-4o-mini,为开发者提供了一个现有长上下文模型的优秀开源替代。
大模型的长文本训练需要消耗大量的计算资源,通义团队通过逐步扩展长度的方法,从预训练到监督微调再到强化学习等多个阶段,高效地将 Qwen2.5-1M
的上下文长度从 4K 扩展到 256K;再通过长度外推的技术,创新引入Dual Chunk
Attention机制,在无需额外训练的情况下,将上下文长度高性能地稳定扩展到1M,从而在较低成本下实现了 Qwen2.5-1M 模型。

同时,为了加快推理速度,通义团队在vLLM推理引擎基础上,引入基于Minference的稀疏注意力机制,并在分块预填充、集成长度外推方案和稀疏性优化等多环节创新改进。基于这些改进的推理框架有效地加快了模型推理速度,在不同模型大小和
GPU 设备上,处理 1M 长度输入序列的预填充速度提升了 3.2 倍到 6.7 倍。
据了解,Qwen2.5-1M已经在魔搭社区ModelScope和HuggingFace等平台开源,开发者可前往下载或直接体验模型;相关推理框架也已在GitHub上开源,帮助开发者更高效地部署Qwen2.5-1M模型。开发者和企业也可通过阿里云百炼平台调用
Qwen2.5-Turbo 模型API,或是通过全新的Qwen Chat平台体验模型性能及效果。
附链接:
演示Demo:https://www.modelscope.cn/studios/Qwen/Qwen2.5-1M-Demo
Modelscope:https://www.modelscope.cn/organization/Qwen
Huggingface:https://huggingface.co/Qwen
开源框架地址:https://github.com/QwenLM/vllm/tree/dev/dual-chunk-attn
Qwen Chat体验:https://chat.qwenlm.ai/
手机国补怎么领取?2025京东买手机参加国家补贴申请入口、具体方法和操作步骤
速看!2025年手机国家补贴这样领,最高立减500元!国家发福利啦!买6000元内手机、平板、智能手表直接补贴15%,最高能省500块!但具体怎么领?哪些机型能用?怎么操作最划算?一文帮你理清楚!2025京东手机国补领取方法:手机京东APP搜索「手机588」或「数码588」 购买手机平板数
2025-04-19
FF股东大会5月举行:邀请股东赞同董事会提案赋能FF和FX战略执行
4月19日(美国加州4月18日),总部位于美国加州的全球共享智能电动出行生态公司Faraday Future(FF)今天宣布,将于2025年5月28日召开年度股东大(AGM),寻求股东批准关键提案,助力公司战略执行和价值增长,FF呼吁股东对所有提案投赞成票。“本次股东大会提案不仅涉及治理机
2025-04-19
联想直营体系赋能技术平权!来酷科技首发大模型极简部署方案
近日,联想集团旗下智慧零售与智能制造企业来酷科技,运营的全国联想直营店正式推出“DeepSeek R1模型本地部署服务”。作为联想集团面向终端消费者的直营零售与直营服务窗口,来酷科技以129元普惠价面向全网开售该服务,通过“智能识别PC配置+一键轻松安装”的极简方式
2025-04-19
阳光充电站:加码光储充,赴百城建千站!
4月18日,阳光充电站百城点亮仪式暨零碳生活节在河南灵宝市举行,携手新能源车主、渠道伙伴、科研机构等发起成立“零碳充电联盟”,旨在通过技术创新与生态共建破解新能源车主补能焦虑,共建智能便捷的充电站产业生态。阳光充电站是阳光新能源打造充电新基建,破解补能
2025-04-19
贝壳董事会主席拟捐赠股票投入居住领域并长期运营
4月17日,贝壳最新公告显示,贝壳董事会主席、首席执行官及控股股东彭永东拟捐赠9,000,000股A类贝壳普通股。在承担相应的纳税义务后,此次捐赠股票将50%税后资金用于居住行业服务者及其家庭成员的医疗健康福利、50%税后资金用于应届毕业生等租客群体的租房帮扶。据悉,
2025-04-17
心所想AI所向,2025凯度品牌日暨春季新品发布会盛大举行
面对厨电行业智能化、品质化升级趋势。4月16日,凯度成功举办了以“心所想·AI所向”为主题的2025凯度品牌日暨春季新品发布会。凯度CEO柯漫、董事长傅平及明星生活家王真儿依次登场,通过理念分享、技术解读、场景演绎,全面诠释“高端新厨电”;重磅推出首个AI数字生命体“
2025-04-17
FF为股民而战:五大举措启动“非法做空阻击战”,打赢梦想实现战
4月17日,Faraday Future(简称“FF”)今日宣布,为捍卫股东价值与信心,公司正式启动五大核心举措,标志着“梦想实现战之潜在非法做空反击战”的正式打响。在公司昨日提交Form D文件后,市场上迅速传播出一系列谣言——包括错误声称Form D表明高管正在出售股份;股价跌破
2025-04-17
Mureka火爆海外,今日正式开放国内登陆入口和API
2024年4月,昆仑万维发布了第一代音乐生成模型Mureka V1(SkyMusic)。2024年8月14日,昆仑万维推出AI音乐商用创作平台Mureka。2025年3月26日,正式发布Mureka O1模型与Mureka V6模型。自Mureka上线以来,在海内外获得了非常好的市场反响,成为全球AI音乐界现象级产品。
2025-04-16
问界M8正式发布:车载小艺一路聊,随时随地问问小艺
4月16日,家庭智慧旗舰SUV鸿蒙智行问界M8正式发布上市,据悉其搭载的鸿蒙座舱重塑家庭出行交互新范式,车载智慧助手小艺能力再升级,展现出卓越的语音交互能力,有问题随时随地都可以问问小艺。全新的小艺搜歌功能,仅需告诉小艺歌词与背景信息,即可“搜”听到想听的歌
2025-04-16
掘金AI千亿赛道 金山云获战略股东持续增持
2025年4月16日,金山云(NASDAQ:KC,HKEX:3896)宣布,将公开发行18,500,000股美国存托股(ADS),每ADS代表该公司15股普通股。同时,金山云还授予ADS承销商购买额外美国存托股的30天选择权。并且,为了方便港美股两地投资者认购,投资者可以选择在此次发行中以普通股代替AD
2025-04-16