阿里云近期在智能编程领域投下了一枚震撼弹,正式对外宣布其AI编程大模型Qwen3-Coder将全面开放源代码。这一消息迅速在业界引发了广泛关注,Qwen3-Coder凭借其出色的代码生成与Agent能力,在Agentic Coding、Agentic Browser-Use以及基础编码任务等多个方面均达到了开源模型的前沿水平,无疑为智能编程技术的发展开启了新篇章。
Qwen3-Coder系列模型提供了多样化的规格选择,而此次率先开源的版本是其性能最为强劲的一款——Qwen3-Coder-480B-A35B-Instruct。该模型基于先进的MoE架构,参数量高达4800亿,激活参数为350亿,原生支持256K的上下文长度,并通过YaRN技术可扩展至1M,这为处理庞大的代码库和复杂动态数据提供了强有力的支撑。
在预训练阶段,阿里云通义团队通过一系列创新策略显著增强了Qwen3-Coder的代码处理能力。数据层面,7.5万亿字节的训练数据中,代码占比高达70%,确保了模型在保持通用性和数学能力的同时,编程能力也达到了卓越水平。在上下文处理方面,模型原生支持的长上下文能力专为大型代码仓库和动态数据设计,大幅提升了Agentic Coding的效率和精准度。团队还采用了合成数据扩展技术,利用Qwen2.5-Coder对低质量数据进行清洗和重写,进一步提升了数据质量。
进入后训练阶段,通义团队引入了执行驱动的大规模强化学习策略,通过自动扩展测试样例,构建了海量的高质量训练实例。这一策略不仅大幅提升了代码的执行成功率,还对其他任务产生了显著的正面效应。在真实世界的软件工程任务中,如SWE-Bench,Qwen3-Coder展现了卓越的自主规划、工具调用和决策能力,在SWE-bench Verified上取得了开源模型的最佳成绩。
为了让开发者更便捷地使用Qwen3-Coder,通义团队还推出了命令行工具Qwen Code。该工具针对Qwen3-Coder系列模型进行了专门的优化,增强了解析器和工具支持,使开发者能够更充分地挖掘模型在代理式编程上的潜力。同时,Qwen3-Coder的API还与Claude Code、Cline等编程工具实现了协同工作,为开发者提供了更加灵活高效的编程体验。
目前,Qwen3-Coder已在魔搭社区和HuggingFace等平台全面开放源代码,全球开发者均可免费下载和使用。该模型即将接入阿里的AI编程产品通义灵码,进一步拓展其应用场景。阿里云百炼平台也已上线了Qwen3-Coder的API,为开发者提供了更为便捷的接入途径。
想要了解更多关于Qwen3-Coder的信息,请访问以下链接:
魔搭社区:https://modelscope.cn/models/Qwen/Qwen3-Coder-480B-A35B-Instruct
Hugging Face:https://huggingface.co/Qwen/Qwen3-235B-A22B-Instruct-2507
Qwen Code GitHub:https://github.com/QwenLM/qwen-code