阿里巴巴Qwen3-Coder可与Claude Sonnet 4媲美(阿里巴巴1688采购网)

阿里巴巴Qwen3-Coder可与Claude Sonnet 4媲美(阿里巴巴1688采购网)

阿里巴巴已推出Qwen3-Coder,这是其迄今最先进的AI编码模型,旨在与西方领先的模型在编程任务上直接竞争。

模型架构与大规模训练

Qwen3-Coder 是 Qwen3 系列的最新成员,该系列于 4 月由阿里巴巴推出,用于通用 AI 应用。 阿里巴巴将此编码版本描述为其迄今最自主代理的模型,旨在处理复杂的多步骤开发工作流程。 其旗舰型号Qwen3-Coder-480B-A35B-Instruct采用专家混合架构,拥有4,800亿个参数,其中350亿个可同时启用。 该模型原生支持高达256,000个token的上下文窗口,并可选择扩展至100万个。

阿里巴巴以7.5万亿个token的庞大数据集训练Qwen3-Coder,其中代码占70%。 为准备这些数据,阿里巴巴使用其先前的Qwen2.5-Coder模型来清理并重写训练语料库。 在后续训练中,阿里巴巴应用了长期强化学习,透过与环境的多阶段互动,教导模型使用工具并处理回馈。 阿里巴巴在Alibaba Cloud上建立了可运行20,000个并行环境的基础设施,以支持此方法。

可与Claude Sonnet 4媲美

阿里巴巴表示 Qwen3-Coder 在需要物理定律推理的任务上表现出色,这是编码模型的常见基准。 根据阿里巴巴的说法,该模型在基于代理的编码、浏览器自动化和工具使用方面,其成绩可与Claude Sonnet 4媲美。

在用于软件工程任务的 SWE-Bench Verified 基准测试中,Qwen3-Coder 在开源模型中展现了最先进的性能,值得注意的是,它无需依赖测试时缩放(通常在推论期间需要额外的计算资源)。 Avi Chawla 进一步比较了 Qwen3-Coder 和 Claude Sonnet 4 在十项 MCP 服务器开发任务中的表现,结果 Qwen3-Coder 在九个案例中胜出,持续取得更高的正确性分数。

以 Gemini Code 为基础

与新模型同时发布的还有 Qwen Code,这是一款供开发者使用的命令行工具。 Qwen Code 以 Gemini Code 为基础,但针对 Qwen3-Coder 进行了优化,更新了提示词和函数呼叫协议,并支持 OpenAI SDK 和环境变量配置。 Qwen3-Coder 还能与现有的开发者工具无缝整合; 例如,搭配Claude Code使用时,需要从Alibaba Cloud Model Studio取得API密钥。

阿里巴巴计划推出更多不同规划的Qwen3-Coder模型,以在降低部署成本的同时提供强劲性能。 阿里巴巴也在探索编码代理是否能随时间自我改进。 尽管480B模型对于标准GPU来说过大,但可通过Alibaba Cloud Model Studio取得API访问权。

开源替代方案

这次发布将 Qwen3-Coder 定位为 Anthropic 和 Google 等公司专有编码助理的开源替代方案,使其有别于大多数西方竞争对手。 鉴于编码任务通常涉及处理大量代码库或文件,API成本可能迅速增加,有时会迫使用户订阅昂贵的服务。 Qwen3-Coder 强大的开源性能可能会对这些供应商构成价格压力。

特别声明:[阿里巴巴Qwen3-Coder可与Claude Sonnet 4媲美(阿里巴巴1688采购网)] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

专访安永吴晓颖:AI医疗需从“炒概念”走向“真落地”(安永ceo)

对想“出海”美国市场的中国药企而言,做好以下几方面准备至关重要:一是紧跟 FDA 关于 AIML 软件的各项草案与最终指导(如今年 1月发布的 AI-enabled Device 软件生命周期管理与申报…

专访安永吴晓颖:AI医疗需从“炒概念”走向“真落地”(安永ceo)

DSPE-PEG2000-pPB 环状寡肽 DSPE-PEG2000-cyclic pPB peptide

pPB:是一种环状寡肽(cyclic peptide),通常用于靶向受体结合,如整合素或其他炎症相关蛋白构建多肽修饰脂质体或纳米粒,用于药物靶向递送 以上资料由小编zhn提供,仅用于科研 DSPE-PEG…

DSPE-PEG2000-pPB 环状寡肽 DSPE-PEG2000-cyclic pPB peptide

英伟达首款AIPC芯片细节曝光:20核CPU、6144个CUDA计算单元(英伟达首款gpu)

7月27日消息,人工智能芯片大厂英伟达(NVIDIA)与联发科合作的首款 Windows on ArmPC处理器N1X的更多细节信息被曝光,其集成的GPU配备了与 RTX 5070显卡相同数量的CUDA计…

英伟达首款AIPC芯片细节曝光:20核CPU、6144个CUDA计算单元(英伟达首款gpu)

499元的小米智能门铃4 Pro,真能给足你安全感?(小米智能产品大全)

小米智能门铃 4 Pro接收器的设计也很用心,正方形造型小巧精致,正面全是扬声器孔,顶部有一个按键,点击一次就能调整音量,长按 3秒还能进行设备配对,采用 220V 供电方式,直接插在墙壁插座或插线板上就…

499元的小米智能门铃4 Pro,真能给足你安全感?(小米智能产品大全)

“搂草打兔子”,兔子重要草重要?

但它也绝不停留在工具的层面,更让我忧虑的是它对学者心态和学术生态的改变。然而,在“不发表就出局”的坚硬现实中,有了大语言模型的助力,却让人文研究更加“卷”了起来。 人文研究,“人”始终应该是主体,别让AI把…

“搂草打兔子”,兔子重要草重要?