Qwen新模型直逼Claude4!可拓展百万上下文窗口,33GB本地即可运行

明敏 发自 凹非寺

量子位 | 公众号 QbitAI

开源编程模型的天花板,要被Qwen3-Coder掀翻了。

今天凌晨, Qwen3-Coder-Flash也重磅开源!

今日霍州(www.jrhz.info)©️

“甜品级”的size,但完全“大餐”级的性能。

  • 多编程任务超越顶级开源模型,仅略逊于闭源的Claude Sonnet-4、GPT-4.1等。

  • 原生上下文窗口支持256k token,可延长拓展至1 million token。

  • 33GB内存(即中端笔记本📓)可运行。

啥概念?

相当于GPT-4.1级别的能力,还能让你本地使用!

今日霍州(www.jrhz.info)©️

有人实测,在苹果M4 Max上通过mlx-lm运行Qwen3-Coder-Flash,每秒可生成4467个token,相当快。

今日霍州(www.jrhz.info)©️

还有人已经火速推出了量化版本,显存不够的童鞋可以来下载使用。

今日霍州(www.jrhz.info)©️

林俊旸也发推表示,这是一个绿色低碳极速版coding模型。

我想这将是本地编程的最好选择。

笔记本📓上就能跑出好效果

Qwen3-Coder-Flash是Qwen3-Coder的精简版,都是非推理模型。

  • 采用MoE架构,30亿参数总量,激活参数3.3亿。

  • 原生上下文窗口支持256k token,通过YaRN等可延长至一百万token上下文,适合大型代码库和复杂多文件工程。

  • 针对Qwen Code、Cline、Roo Code、Kilo Code等平台进行优化。

  • 无缝支持函数调用和agent工作流。

主要强调了 Agent方面的能力:

  • Agentic Coding(智能体编程)

  • Agentic Browser Use(智能体浏览器使用)

  • Agentic Tool Use(智能体工具调用)

有博主在M2 Macbook Pro上用量化版Qwen3-Coder-Flash( 24.82GB 6bit MLX版)做的游戏,运行效果很不错。

今日霍州(www.jrhz.info)©️

而且提示词也很短,就一句话:

Write an HTML and Java page implementing space invaders.

这意味着训练数据中可能存在大量相关或者类似任务,才能让模型一次就能输出非常好的效果。

博主在首次尝试后,感觉飞船发射的子弹太快了,所以想要让它降速一点。

由于他使用的Open WebUI没有类似于Claude Artifacts的工具调用的功能,这意味着模型需要重新输出一个完整结果,实测表明它确实可以做到。

此外他还实测了生成鹈鹕骑自行车,每秒60个tokens,不过效果有点问题。

今日霍州(www.jrhz.info)©️

但u1s1,最近Qwen的开源节奏实在是太快了,更新模型一箩筐:

  • Qwen3-Embedding

  • Qwen-Vlo

  • Qwen-TTS

  • Qwen3-235B-A22B

  • Qwen3-Coder

  • Qwen-MT

  • Qwen3-235B-A22B-Thinking-2507

  • Qwen3-30B-A3B-Instruct-2507

  • ……

而且都开源了,还提出了很多小显存友好的方案。

开源之光的title在国产模型这里竞争格外激烈啊(doge)

最后,Qwen3-Coder-Flash体验方式如下,感兴趣的同学快去体验吧!

QwenChat:chat.qwen.ai

魔搭社区:https://www.modelscope.cn/models/Qwen/Qwen3-Coder-30B-A3B-Instruct

HF:https://huggingface.co/Qwen/Qwen3-Coder-30B-A3B-Instruct

特别声明:[Qwen新模型直逼Claude4!可拓展百万上下文窗口,33GB本地即可运行] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

『熊黛林』新加坡度假名场面:1.5小时化妆卷疯了,7岁女儿“龅牙”萌翻,老公烤肉分工太甜(『熊黛林』专访)

从1.5小时精致化妆的模特素养,到7岁女儿换牙期的“龅牙”萌态,再到夫妻默契分工烤肉的温馨,每个细节都戳中网友笑点与泪点,更让人看清:比起过往的遗憾,当下的圆满才是最好的人生答卷。 这场新加坡度假,不仅展现了…

『熊黛林』新加坡度假名场面:1.5小时化妆卷疯了,7岁女儿“龅牙”萌翻,老公烤肉分工太甜(『熊黛林』专访)

BAUNAT宝欧娜联袂比利时德尔菲娜Delphine公主推出独家合作系列—— Eternal Bloom 永恒绽放(欧宝娜是什么品牌)

该系列是品牌与 比利时德尔菲娜公主(Princess Delphine de Saxe-Cobourg) 联袂推出的独家合作系列作品,以璀璨珠宝艺术,致敬爱、坚韧与恒久之美,融合欧洲艺术精神与当代创意力量。每…

BAUNAT宝欧娜联袂比利时德尔菲娜Delphine公主推出独家合作系列—— Eternal Bloom 永恒绽放(欧宝娜是什么品牌)

大尺度电影《苦月亮》欲望失控的那一刻,一切都开始变质(大尺度电影《短发》在线观看)

它更像一场深夜低语,缓慢、黏稠,让人越看越不安,却又停不下来。 你会发现,这部电影真正让人窒息的,并不是尺度,而是那种逐渐失去尊严的亲密。 如果你能接受一部让人看完后久久沉默的电影,《苦月亮》值得被认真看完…

大尺度电影《<strong>苦月亮</strong>》欲望失控的那一刻,一切都开始变质(大尺度电影《<strong>短发</strong>》在线观看)

『金晨』被曝肇事逃逸当地村民称撞了墙 事故细节曝光(『金晨』疑似回应)

1月29日,演员『金晨』被曝涉嫌交通肇事逃逸。网传绍兴市公安局柯桥区分局交通警察大队出具的《道路交通事故认定书》显示,事故发生在2025年3月16日下午5时许,地点位于绍兴市柯桥区湖塘街道岭下村公交站附近。当地警方证实了该事故认定书的真实性

『金晨』被曝肇事逃逸当地村民称撞了墙 事故细节曝光(『金晨』疑似回应)

一图读懂,2025年看数字广州如何加“数”前行?(一图读懂2025年最高法工作报告)

2025年,数字广州建设不断向纵深推进,城市大脑的智慧脉搏在云山珠水间强劲搏动。 广州市政务服务和数据管理局用一组组充满活力的数据,描绘着城市治理现代化与数字生活的新图景。这些关键数据,是无数数字广州建设者的…

一图读懂,2025年看数字广州如何加“数”前行?(一图读懂2025年最高法工作报告)