通义Qwen3非思考模型上新多项能力达到Gemini2.5、GPT-4o水平

科技fjmyhfvclm2026年02月04日 13:43117阅读

凤凰网科技讯 7月30日，阿里巴巴『通义千问』团队宣布推出Qwen3系列模型的最新版本 ——Qwen3-30B-A3B-Instruct-2507。这一非思考模式（non-thinking mode）的开源模型仅需激活3B参数，即可在多项核心能力上达到与Gemini 2.5-Flash（non-thinking）、GPT-4o等闭源模型相当的性能水平，同时在多语言覆盖、用户偏好对齐和长文本处理等领域实现突破性提升。目前，该模型已在魔搭社区（ModelScope）和HuggingFace平台全面开源。

今日霍州(www.jrhz.info)©️

作为Qwen3-30B-A3B模型中的新版本，Qwen3-30B-A3B-Instruct-2507延续了『通义千问』团队在架构创新上的优势，在大幅降低计算成本的同时，实现了与千亿级闭源模型的性能对标。官方数据显示，该模型在数学推理（AIME25测试得分61.3）、代码生成（LiveCodeBenchv6得分43.2）、研究生级物理和天文学问题（GPQA测试得分70.4）、人类偏好对齐（Arena-Hard v2得分69）、函数调用能力（BFCL-v3得分65.1）等关键基准测试中表现突出，部分指标甚至超越GPT-4o等。

今日霍州(www.jrhz.info)©️

在通用能力层面，模型全面强化了指令遵循、逻辑推理、数学、科学、编程及工具使用等多方面。在多语言的长尾知识覆盖方面，模型进步显著；在主观和开放任务中，新模型与进一步紧密对齐了用户偏好，可以生成更高质量的文本，为用户提供更有帮助的回答；长文本理解能力提升至256K。

『通义千问』是阿里巴巴达摩院自主研发的『大语言模型』系列，自2023年发布以来，已开源超200个模型，全球下载量突破3亿次，衍生模型数超10万个。

能力文本处理语言偏好得分

特别声明：[通义Qwen3非思考模型上新多项能力达到Gemini2.5、GPT-4o水平] 该文观点仅代表作者本人，今日霍州系信息发布平台，霍州网仅提供信息存储空间服务。

猜你喜欢

2026-01-26

昔日在荧幕上光彩照人的外籍女『明星』️，现今模样大变！(昔日的光彩是什么意思)

经历了人生的大起大落后，现在的她显得沧桑了许多，身材发福，眼神透着疲惫，曾经那个叱诧风云的流行天后，似乎早已不再是眼前的她。如今，历经生活风雨的她，脸上已经写满了岁月的痕迹，容颜不再，但那份坚韧依然深深打动人…

昔日在荧幕上光彩照人的外籍女『明星』️，现今模样大变！(昔日的光彩是什么意思)

2026-01-26

闽侯南屿闲置边角空地变活力打卡点，新增3条智慧健身路径(闽侯南屿2021规划)

南屿镇的智慧健身路径正是为了满足这一需求而设立的，它将健康生活融入居民的日常，提高了居民的获得感与幸福感。希望每个人都能在智慧健身路径上找到属于自己的快乐，迈向更健康的未来！你认为智慧健身路径对提升居民健康…

闽侯南屿闲置边角空地变活力打卡点，新增3条智慧健身路径(闽侯南屿2021规划)

2026-01-26

马斯克的“超级学习力”背后：卓越型脑能结构才是关键

作为核心技术基座之一，脑能家庭教育陪跑机制能帮助父母在家庭场景中精准导入卓越型脑能思维链，让孩子的自主学习能力自然形成，而非依赖外力催促。随着AI技术替代大量重复型任务，未来社会真正稀缺的是跨域迁移、结构建…

马斯克的“超级学习力”背后：卓越型脑能结构才是关键

2026-01-26

警方谈游客称在衡山丢金吊坠：已沿线搜寻，暂未找到

1月24日，一名游客反映在湖南衡阳的南岳衡山景区内，丢失了一块重80.99克的金饰吊坠。1月25日，记者从衡阳市公安局南岳分局半山亭派出所了解到，警方已接到相关报警，目前仍在继续搜寻。该游客告诉记者，发现金饰丢失后，便立即向景区工作人员反馈

警方谈游客称在衡山丢金吊坠：已沿线搜寻，暂未找到

2026-02-01

昔日硬汉竟不知自己患病？妻子曝光布鲁斯·威利斯现状

这一信息让许多人感到震惊，因为这位曾经在银幕上纵横捭阖的硬汉，竟然无法意识到自己的病痛。艾玛特别提到，很多人会误以为病人是在心理上不愿面对病情，但她坦言，这不过是大脑遭遇损伤后的生理反应而已。正如艾玛所说：布…

昔日硬汉竟不知自己患病？妻子曝光布鲁斯·威利斯现状