阿里云突袭上线新一代通义千问模型Qwen3,部署成本极大降低

阿里云突袭上线新一代通义千问模型Qwen3,部署成本极大降低

从4月中旬就在传闻将上线的阿里新一代通义千问模型Qwen3,终于在4月29日凌晨发布了。

Qwen3可以说是阿里大模型的集大成者,在全球开发者社区GitHub发布四个小时后,便获得了1.7万个星标,刷新了开源大模型的热度纪录。

此次Qwen3一共开源了8款“混合推理模型”。其中包括两款MoE(混合专家)模型:Qwen3-235B-A22B(2350多亿总参数、 220多亿激活参),以及Qwen3-30B-A3B(300亿总参数、30亿激活参数)。以及六个Dense(稠密)模型:Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B和Qwen3-0.6B。

其中,Qwen3-235B-A22B是Qwen3系列模型中性能最强的。阿里Qwen3技术文档披露,它在基准测试中的得分,和DeepSeek-R1、OpenAI旗下的o1、o3-mini,谷歌的 Gemini-2.5-Pro等全球一流大模型不相上下。

作为一款“混合推理模型”,Qwen3将“快思考”与“慢思考”集成进同一个模型,对简单需求可低算力“秒回”答案。特别是对复杂问题可多步骤“深度思考”,节省算力消耗。

Qwen3总参数量235B,激活仅需22B。阿里称,仅需4张H20即可部署Qwen3满血版,显存占用仅为性能相近模型的三分之一。

同时,Qwen3模型也支持119种语言和方言,意味着Qwen 3瞄准了国际应用。

Qwen3也为即将到来的智能体Agent和大模型应用爆发提供了更好的支持。在评估模型Agent能力的BFCL评测中,Qwen3创下70.8的新高,超越Gemini2.5-Pro、OpenAI-o1等顶尖模型,这将大幅降低Agent调用工具的门槛。

同时,Qwen3也原生支持MCP协议,并具备强大的工具调用能力,结合封装了工具调用模板和工具调用解析器的Qwen-Agent框架。这将大大降低编码复杂性,实现高效的手机及电脑Agent操作等任务。

特别声明:[阿里云突袭上线新一代通义千问模型Qwen3,部署成本极大降低] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

WildCard野卡用不了,提示“系统繁忙”?别慌,ChatGPT Plus充值看这篇就够了!(野卡是什么意思)

这一消息如平地惊雷,让我们赖以维系的ChatGPT Plus等海外服务的续费路径戛然而止。它像一把钥匙,打开了通往海外优质API服务的大门。 这个新方案的核心,是一个专注于提供自动化充值服务的网站。对于从Wi…

WildCard野卡用不了,提示“系统繁忙”?别慌,ChatGPT Plus充值看这篇就够了!(野卡是什么意思)

有一种“算计”叫张碧晨,去父留子看似算盘落空,实则是人生赢家

孩子的母亲是和他同样身份的歌手张碧晨,在此前两人几乎没有什么联系,被人造谣她曾向孩子的父亲索要两亿分手费,因为这个她的事业也受到了影响,她的出场报价暴跌, 她本人的热度也跟着上升,饺子导演还在采访的时候特…

有一种“算计”叫张碧晨,去父留子看似算盘落空,实则是人生赢家

海尔空调一城一气候健康列车,驶入千年古都西安(海尔空调一阵一阵的吹怎么回事)

本次活动,海尔空调精准对标关中雾霾、陕北风沙干燥、陕南潮湿闷热三大区域气候痛点,通过“海尔空调AI科技”,为三秦用户定制“因地制宜、因人而异”的健康空气解决方案,开启智慧住居新篇章。未来,海尔空调将持续以科技…

海尔空调一城一气候健康列车,驶入千年古都西安(海尔空调一阵一阵的吹怎么回事)

无与伦比!影坛传奇女神,斯嘉丽·约翰逊,性感与美丽的完美融合(无与伦比mv)

在《迷失东京》中,斯嘉丽·约翰逊饰演的年轻女子夏洛特,其孤独迷茫又充满探索的形象深入人心,她凭借此片获得了众多奖项的提名,也让观众看到了她在文艺片中的独特魅力。 她不仅在动作戏中展现出了惊人的爆发力和敏捷度…

无与伦比!影坛传奇女神,斯嘉丽·约翰逊,性感与美丽的完美融合(无与伦比mv)

朝雪录爆了!这四部古装悬疑探案剧,部部高能太敢拍了!(朝雪初晴 在线阅读)

虽然《朝雪录》即将迎来大结局,但我们依然有四部古装悬疑探案剧值得期待!这部剧由许凯和田曦薇搭档,讲述了一位冷酷的天师与一只顽皮猫妖之间的故事。本季的剧情和悬疑都得到了升华,十个离奇案件交织着权力斗争,从人皮…

朝雪录爆了!这四部古装悬疑探案剧,部部高能太敢拍了!(朝雪初晴 在线阅读)