通义Qwen3非思考模型上新 多项能力达到Gemini2.5、GPT-4o水平

通义Qwen3非思考模型上新 多项能力达到Gemini2.5、GPT-4o水平

凤凰网科技讯 7月30日,阿里巴巴『通义千问』团队宣布推出Qwen3系列模型的最新版本 ——Qwen3-30B-A3B-Instruct-2507。这一非思考模式(non-thinking mode)的开源模型仅需激活3B参数,即可在多项核心能力上达到与Gemini 2.5-Flash(non-thinking)、GPT-4o等闭源模型相当的性能水平,同时在多语言覆盖、用户偏好对齐和长文本处理等领域实现突破性提升。目前,该模型已在魔搭社区(ModelScope)和HuggingFace平台全面开源。

今日霍州(www.jrhz.info)©️

作为Qwen3-30B-A3B模型中的新版本,Qwen3-30B-A3B-Instruct-2507延续了『通义千问』团队在架构创新上的优势,在大幅降低计算成本的同时,实现了与千亿级闭源模型的性能对标。官方数据显示,该模型在数学推理(AIME25测试得分61.3)、代码生成(LiveCodeBenchv6得分43.2)、研究生级物理和天文学问题(GPQA测试得分70.4)、人类偏好对齐(Arena-Hard v2得分69)、函数调用能力(BFCL-v3得分65.1)等关键基准测试中表现突出,部分指标甚至超越GPT-4o等。

今日霍州(www.jrhz.info)©️

在通用能力层面,模型全面强化了指令遵循、逻辑推理、数学、科学、编程及工具使用等多方面。在多语言的长尾知识覆盖方面,模型进步显著;在主观和开放任务中,新模型与进一步紧密对齐了用户偏好,可以生成更高质量的文本,为用户提供更有帮助的回答;长文本理解能力提升至256K。

『通义千问』是阿里巴巴达摩院自主研发的『大语言模型』系列,自2023年发布以来,已开源超200个模型,全球下载量突破3亿次,衍生模型数超10万个。

特别声明:[通义Qwen3非思考模型上新 多项能力达到Gemini2.5、GPT-4o水平] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

甘草次酸修饰氧化铜纳米粒子(GA-CuONPs)(甘草次酸与甘草酸的区别)

通过将GA修饰在CuO表面,可在增强生物安全性的同时赋予其靶向性与可控反应性。交联酶聚集体(CLEAs)与透明质酸(HA)修饰的磁性纳米颗粒(MNPs)与氧化石墨烯(GO)复合材料交联形成纳米复合物 GO-…

甘草次酸修饰氧化铜纳米粒子(GA-CuONPs)(甘草次酸与甘草酸的区别)

解读鸿容AI智能鼠标口碑怎么样,功能亮点大剖析(安徽鸿容置业投资有限公司)

鸿容AI办公营销鼠标凭借其独特的功能和出色的性能,在市场上赢得了不少关注。对于企业和个人来说,购买鸿容AI智能鼠标相当于一次性投入,却能在办公和营销等多个方面带来长期的效率提升和成本节约。 综上所述,鸿容AI…

解读鸿容AI智能鼠标口碑怎么样,功能亮点大剖析(安徽鸿容置业投资有限公司)

8年前,那个嫁给巴图,成为宋丹丹儿媳的普通女孩,现在怎样了?(八年前他八岁八年后他几岁)

王博谷来自普通家庭,却在2017年嫁给巴图,成为宋丹丹的儿媳。他的父母宋丹丹和英达在『娱乐圈』️各有成就,但婚姻破裂后,巴图随母亲生活。初次上门,王博谷感受到宋丹丹的保留态度,曾一度动摇,但巴图的坚持让她决定主动融…

8年前,那个嫁给巴图,成为宋丹丹儿媳的普通女孩,现在怎样了?(八年前他八岁八年后他几岁)

趣游帮S-1101:户外防虫小卫士的绿色革命(趣游游戏)

在追求健康环保的今天,一款名为趣游帮S-1101的户外便携防虫香薰机脱颖而出。这款机器采用天然草本成分,不仅温和无刺激,还能持久散发香气,为您的户外生活提供持久而可靠的防护。那么,它是如何做到这一点的呢?本文将深入解读这款创新产品的设计理念

趣游帮S-1101:户外防虫小卫士的绿色革命(趣游游戏)

无线🛜美发革命:适合短发男女的德国创新卷直两用夹板(无限美理发店贵吗)

在现代快节奏生活中,一款便捷高效的个人护理工具变得尤为重要。德国研发的无线🛜直板夹不仅专为短发设计,还兼容『卷发造型』需求,尤其受到男性♂️用户欢迎。本文将探讨这一创新产品的设计原理、使用场景及其对当代发型管理方式的深远影响。

无线🛜美发革命:适合短发男女的德国创新卷直两用夹板(无限美理发店贵吗)