中国电商巨头阿里巴巴旗下的通义千问团队近日再度传来捷报,其在人工智能领域的探索又迈出了重要一步。团队不仅免费发布了开源许可的Qwen3-235B-A22B-2507模型,这一模型已跻身世界顶尖非推理大语言模型之列,与谷歌、OpenAI等巨头的专有AI模型相媲美,而且紧接着推出了另一款重量级产品——Qwen3-Coder-480B-A35B-Instruct。
Qwen3-Coder-480B-A35B-Instruct是一款专注于软件开发的新开源大语言模型,旨在简化复杂的编程工作流程,能够在极短时间内创建出功能完备的应用程序。这一模型的问世,无疑为软件开发领域带来了新的变革。
据悉,Qwen3-Coder在智能体编程任务中表现出色,与Claude Sonnet-4等专有产品展开竞争,并在开源模型中创造了新的基准分数。目前,该模型已在Hugging Face、GitHub、通义千问聊天平台、阿里巴巴通义千问API以及众多第三方编程和AI工具平台上上线,供开发者们免费使用。
尤为与Claude等专有模型不同,Qwen3-Coder采用了Apache 2.0开源许可证,这意味着任何企业都可以无限制地获取、下载、修改、部署,并在其商业应用中使用该模型,无需向阿里巴巴或任何其他方支付任何费用。这一举措无疑大大降低了企业的成本,提高了其选择性。
在第三方基准测试中,Qwen3-Coder展现出了卓越的性能。AI高级用户在使用该模型进行“感知编程”时,也给予了高度评价。有专家指出,Qwen3-Coder可能是迄今为止最好的编程模型,其在通用性方面表现出色,而在编程能力上更是独树一帜。
对于有兴趣下载的开发者和企业来说,可以在AI代码共享仓库Hugging Face上轻松找到Qwen3-Coder的代码。同时,对于不希望或没有能力自己托管模型的企业,也可以通过阿里云通义千问API直接使用该模型,费用按Token计算,提供了多种套餐选择。
Qwen3-Coder的模型架构同样令人瞩目。该模型采用了专家混合(MoE)技术,总参数高达4800亿,每次查询激活350亿参数。其原生支持256K Token上下文长度,使用YaRN技术可外推至100万Token,这一能力使得模型能够在单次处理中理解和操作整个代码仓库或冗长文档。
在性能表现方面,Qwen3-Coder在多个智能体评估套件中取得了领先成绩。在SWE-bench Verified测试中,其标准分数和500轮分数均超过了GPT-4.1和Gemini 2.5 Pro Preview,与Claude Sonnet-4不相上下。该模型在智能体浏览器使用、多语言编程和工具使用等任务中也展现出了强大的实力。
除了模型本身,通义千问还开源了Qwen Code这一CLI工具,进一步简化了Qwen3-Coder的集成和使用。Qwen Code支持Node.js环境,可通过npm或源码安装,并支持函数调用和结构化提示,使得Qwen3-Coder更容易融入编程工作流程。
Qwen3-Coder还与多个开发者平台实现了集成,包括Claude Code、Cline、Ollama、LMStudio等,为开发者提供了更多的选择和便利。开发者可以本地运行Qwen3-Coder,或通过阿里云托管的端点使用OpenAI兼容API进行连接。
在训练技术方面,Qwen3-Coder同样不容小觑。除了在7.5万亿Token(其中70%为代码)上进行预训练外,该模型还采用了先进的后训练技术,包括代码强化学习和长期智能体强化学习。这些技术使得Qwen3-Coder能够在多样化、可验证的代码任务上进行高质量、执行驱动的学习,并在多轮交互中进行规划、使用工具和适应。
对于企业而言,Qwen3-Coder提供了封闭源码专有模型的开放、高能力替代方案。其强大的编程执行和长上下文推理能力,使其在代码库级理解、自动化拉取请求工作流程、工具集成和编排等方面具有广泛的应用前景。同时,作为开源模型,企业可以在自己的基础设施上部署Qwen3-Coder,避免了供应商锁定,并更直接地管理计算使用。
在开发者社区中,Qwen3-Coder同样受到了广泛的关注和好评。AI研究员、工程师和开发者们在现实编程工作流程中测试了该模型,并对其性能、适应性和与现有开发堆栈的集成能力给予了高度评价。一些专家甚至认为,Qwen3-Coder在编程模型领域树立了新的标杆。