IT时报记者 郝俊慧
“王炸”一个接着一个。
7月23日清晨,阿里开源全新的通义千问AI编程大模型Qwen3-Coder,编程能力登顶全球开源模型阵营,并超越GPT4.1等闭源模型,比肩全球最强的编程模型Claude 4。截至7月23日19点,全球程序员云集的Github上已为Qwen3-Coder打出6400颗星。
Qwen3-Coder在代码能力及Agent调用能力方面取得重大突破。它在代码占比70%的7.5T数据上预训练,在后训练阶段进行了编程任务及智能体任务的强化学习,最终实现了通用能力、代码能力及Agent能力的飞升。
其中,能力最强的Qwen3-Coder-480B-A35B-Instruct在Agentic Coding(自主编程)、Agentic Browser-Use(自主网页浏览)和Agentic Tool-Use(自主调用工具)上取得了开源模型的SOTA(最佳效果),媲美Claude Sonnet 4。
借助Qwen3-Coder,刚入行的程序员一天就能完成资深程序员一周的工作,生成一个品牌官网最快只需5分钟。
支持智能体自主编程Qwen3-Coder是千问系列模型中首个采用混合专家MoE架构的代码模型,总参数达480B,激活35B参数。也就是说,推理时仅需激活35B参数,因此可以在较低的计算成本下实现高性能,大大节省了算力消耗,上下文长度也有了很大提升,原生支持256Ktoken的上下文并可通过YaRN扩展到1Mtoken,
Qwen3-Coder具备出色的Agent能力,尤为擅长解决多步骤的长任务,它能通观全局自主安排工作内容,支持Agent调用各种工具深入钻研,最终解决复杂编程任务。
基于Qwen3-Coder,网页开发、AI搜索、深度研究等智能体应用将变得更智能、更高效。实测数据显示,在执行任务时,Qwen3-Coder能够调用的工具数量比Claude多几倍,效果非常出色。
Qwen3-Coder能帮助程序员完美完成基础编程任务,比如写代码、补全代码、修Bug等,编程工作效率大幅提升,代码测试、查询生成等工作从人工编写的数小时骤降至数分钟。同时,Qwen3-Coder也极大降低了普通人入门编程的门槛,让AI氛围编程(Vibe Coding)真正成为现实,一句话就能生成精妙复杂的3D物理模拟过程。
压力给到Claude 4编码能力是许多智能体实现复杂任务的关键。此前最受开发者欢迎的编码大模型是Claude 4,但价格不菲。记者从Anthropic公司官网上看到,Claude Sonnet 4的输入费用是3美元/百万token,输出费用是15美元/百万token。
由于Qwen3-Coder 在智能体编码、浏览器使用和工具使用等基准测试中已经与Claude Sonnet 4相媲美,开源之后,可以为开发者提供一个强大的、可免费使用的工具,大大降低了开发编码辅助、自动化开发、甚至能够自主完成软件工程任务智能体的门槛。
同时,Qwen3-Coder 会对闭源模型形成压力,尤其是在纯粹的编码任务上,迫使 Anthropic重新评估其针对编码相关用例的定价策略。
业内人士指出,开源的Qwen3-Coder有望取代昂贵的Claude,成为Agent领域最受欢迎的编程模型。
据了解,Qwen3-Coder已在魔搭社区、HuggingFace等平台开源,全球开发者都可以免费下载使用。Qwen3-Coder很快将接入阿里的AI编程产品通义灵码,API也已上线阿里云百炼。
为方便开发者更好地使用Qwen3-Coder,通义团队还开源了一款命令行工具QwenCode,可充分发挥Qwen3-Coder在代理式编程上的潜力。此外,Qwen3-Coder的API可以和ClaudeCode、Cline等工具协同使用。
截至目前,千问系列编程模型全球下载量已突破2000万次,是全球最受欢迎的开源编程模型。据悉,阿里巴巴内部已开始大量使用AI编程。一汽集团、中国石油、建设银行、平安集团、南方航空、小鹏汽车等各行业头部企业也已接入千问AI编程模型。