通义Qwen3非思考模型上新 多项能力达到Gemini2.5、GPT-4o水平

通义Qwen3非思考模型上新 多项能力达到Gemini2.5、GPT-4o水平

凤凰网科技讯 7月30日,阿里巴巴『通义千问』团队宣布推出Qwen3系列模型的最新版本 ——Qwen3-30B-A3B-Instruct-2507。这一非思考模式(non-thinking mode)的开源模型仅需激活3B参数,即可在多项核心能力上达到与Gemini 2.5-Flash(non-thinking)、GPT-4o等闭源模型相当的性能水平,同时在多语言覆盖、用户偏好对齐和长文本处理等领域实现突破性提升。目前,该模型已在魔搭社区(ModelScope)和HuggingFace平台全面开源。

作为Qwen3-30B-A3B模型中的新版本,Qwen3-30B-A3B-Instruct-2507延续了『通义千问』团队在架构创新上的优势,在大幅降低计算成本的同时,实现了与千亿级闭源模型的性能对标。官方数据显示,该模型在数学推理(AIME25测试得分61.3)、代码生成(LiveCodeBenchv6得分43.2)、研究生级物理和天文学问题(GPQA测试得分70.4)、人类偏好对齐(Arena-Hard v2得分69)、函数调用能力(BFCL-v3得分65.1)等关键基准测试中表现突出,部分指标甚至超越GPT-4o等。

在通用能力层面,模型全面强化了指令遵循、逻辑推理、数学、科学、编程及工具使用等多方面。在多语言的长尾知识覆盖方面,模型进步显著;在主观和开放任务中,新模型与进一步紧密对齐了用户偏好,可以生成更高质量的文本,为用户提供更有帮助的回答;长文本理解能力提升至256K。

『通义千问』是阿里巴巴达摩院自主研发的『大语言模型』系列,自2023年发布以来,已开源超200个模型,全球下载量突破3亿次,衍生模型数超10万个。

特别声明:[通义Qwen3非思考模型上新 多项能力达到Gemini2.5、GPT-4o水平] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

9 个月,30人团队降维打击挑战好莱坞,OpenAI首部动画电影杀进戛纳

更令人震惊的是,这部影片的制作团队只有约 30 人,计划用 9 个月时间完成,预算控制在 3000 万美元💵以内 ——这仅仅是传统动画电影制作成本和时间的零头。它采用了一种「AI 优先」的方法,由人类创作者…

9 个月,30人团队降维打击挑战好莱坞,OpenAI首部动画电影杀进戛纳

她是剧组的场记,却成功饰演了清冷高贵飘逸出尘的嫦娥仙子。(她是剧组的场面英文)

杨洁导演是抱着唯美主义的要求来拍西游记的,她努力用美来展现五光十色的神话世界,而女性♀️是其中最美的。 当时杨洁导演正为选嫦娥这一角色犯难,漂亮演员不难找,但都不符合嫦娥那种仙气飘飘不食人间烟火的那种形象。让邱佩…

她是剧组的场记,却成功饰演了清冷高贵飘逸出尘的嫦娥仙子。(她是剧组的场面英文)

当代歌坛评选首届港台十大东方歌星:『林志颖』、苏有朋上榜(当代歌坛评选1994-1998十大港台歌星)

张信哲虽然1988年已经出道,但是因为服兵役两年,所以他真正在乐坛发力是从1992年开始,难以抗拒你容颜、爱如潮水是其滚石时期的代表作,恰恰是1994年以前的事情。 金城武和苏有朋、『吴奇隆』、『林志颖』并称“台湾…

当代歌坛评选首届港台十大东方歌星:『林志颖』、苏有朋上榜(当代歌坛评选1994-1998十大港台歌星)

女子散步时踩到“化骨水”去世 氢氟酸悲剧引发关注(女子踩鞋后买走)

杭州警方通报了一起女子因踩到氢氟酸不幸去世的事件。9月9日,52岁的涂某某在闲林中路附近空地散步时,不慎接触了废弃的氢氟酸,随后被紧急送医。尽管经过全力抢救,涂某某仍于9月14日凌晨不幸身亡。目前,涉案氢氟酸的来源还在进一步调查中

女子散步时踩到“化骨水”去世 氢氟酸悲剧引发关注(女子踩鞋后买走)

『王一博』观看法网公开赛决赛,现场生图路透,没有技巧,就是硬帅(我想看『王一博』的)

没想到法网公开赛在CCTV5号同步播出,『王一博』就这么出现在自己喜欢的频道上。 我最喜欢『王一博』的地方是,承受了内娱最多的网暴造谣谩骂,看多了内娱的尔虞我诈的虚伪,依然能保持内心的纯净,不卖惨,不屈服,不同流合…

『王一博』观看法网公开赛决赛,现场生图路透,没有技巧,就是硬帅(我想看『王一博』的)