阿里云突袭上线新一代『通义千问』模型Qwen3,部署成本极大降低

阿里云突袭上线新一代『通义千问』模型Qwen3,部署成本极大降低

从4月中旬就在传闻将上线的阿里新一代『通义千问』模型Qwen3,终于在4月29日凌晨发布了。

Qwen3可以说是阿里大模型的集大成者,在全球开发者社区GitHub发布四个小时后,便获得了1.7万个星标,刷新了开源大模型的热度纪录。

此次Qwen3一共开源了8款“混合推理模型”。其中包括两款MoE(混合专家)模型:Qwen3-235B-A22B(2350多亿总参数、 220多亿激活参),以及Qwen3-30B-A3B(300亿总参数、30亿激活参数)。以及六个Dense(稠密)模型:Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B和Qwen3-0.6B。

其中,Qwen3-235B-A22B是Qwen3系列模型中性能最强的。阿里Qwen3技术文档披露,它在基准测试中的得分,和『DeepSeek』-R1、OpenAI旗下的o1、o3-mini,谷歌的 Gemini-2.5-Pro等全球一流大模型不相上下。

作为一款“混合推理模型”,Qwen3将“快思考”与“慢思考”集成进同一个模型,对简单需求可低算力“秒回”答案。特别是对复杂问题可多步骤“深度思考”,节省算力消耗。

Qwen3总参数量235B,激活仅需22B。阿里称,仅需4张H20即可部署Qwen3满血版,显存占用仅为性能相近模型的三分之一。

同时,Qwen3模型也支持119种语言和方言,意味着Qwen 3瞄准了国际应用。

Qwen3也为即将到来的智能体Agent和大模型应用爆发提供了更好的支持。在评估模型Agent能力的BFCL评测中,Qwen3创下70.8的新高,超越Gemini2.5-Pro、OpenAI-o1等顶尖模型,这将大幅降低Agent调用工具的门槛。

同时,Qwen3也原生支持MCP协议,并具备强大的工具调用能力,结合封装了工具调用模板和工具调用解析器的Qwen-Agent框架。这将大大降低编码复杂性,实现高效的手机及电脑Agent操作等任务。

特别声明:[阿里云突袭上线新一代『通义千问』模型Qwen3,部署成本极大降低] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

55岁孙浩的人生浮沉:因中华民谣爆红,拒杨坤结怨,单身至今(孙浩的生活)

特别是在扫黑风暴中,他饰演的反派角色让观众眼前一亮,迎来了事业的第二春。 在这个习惯用婚姻定义成功的社会里,孙浩用自己的人生诠释了另一种可能:幸福从来不是千篇一律的模板,而是找到最适合自己的活法。正如他在一次…

55岁孙浩的人生浮沉:因中华民谣爆红,拒杨坤结怨,单身至今(孙浩的生活)

甜美女宝宝春夏休闲百搭学步鞋,蕾丝花边公主单鞋软底防滑真香推荐!(漂亮女宝宝婴儿)

专为0-3岁萌娃设计的甜美元💵气学步鞋,采用软底防滑结构+精致蕾丝花边,兼顾颜值与实用性。适合日常居家、户外散步、幼儿园『穿搭』,呵护宝宝脚丫发育。本文从材质安全、防滑性能、尺码选择到选购避坑指南全解析,帮你轻松挑对“第一双好鞋”,让宝贝每一步都

甜美女宝宝春夏休闲百搭学步鞋,蕾丝花边公主单鞋软底防滑真香推荐!(漂亮女宝宝婴儿)

54岁广东名嘴阮星航:父母是老师,与胡向真分开后娶女富商生两子(广东台阮芳)

节目停播后,两人各自发展,胡向真专注事业至今未婚,而阮星航则继续在演艺圈深耕。此后,他陆续主持了《生存大挑战》《相聚珠江》等多档节目,并参与粤语益智节目《粤讲越掂》的录制,为推广本土文化贡献力量。 在个人生活…

54岁广东名嘴阮星航:父母是老师,与胡向真分开后娶女富商生两子(广东台阮芳)

从一个普通人到家喻户晓,尼格买提他的奋斗之路值得我们学习(从一个普通人到国家总统需要多久)

尼格买提也用实际行动展现了民族文化的独特魅力。尼格买提用音乐的力量,将梦想和文化完美结合在了一起。他用自己的音乐感染和鼓舞着更多的人,让大家看到了民族文化的独特魅力,也看到了追求梦想的力量。 正是因为有了…

从一个普通人到家喻户晓,尼格买提他的奋斗之路值得我们学习(从一个普通人到国家总统需要多久)

中方强烈谴责以色列袭击卡塔尔 破坏和平努力(中方坚决反对强烈谴责)

联合国人权理事会第60届会议于9月16日就以色列袭击卡塔尔一事举行紧急辩论,该辩论是应伊斯兰合作组织的要求进行的。中国常驻联合国日内瓦办事处和瑞士其他国际组织代表陈旭出席并发言

中方强烈谴责以色列袭击卡塔尔 破坏和平努力(中方坚决反对强烈谴责)