开源大模型得分新纪录!阿里千问3性能全球第三(开源模拟)

潮新闻客户端 记者 张云山

8月2日凌晨,国际权威大模型评测 Chatbot Arena更新了最新一期的大模型榜单,上周新鲜开源的阿里千问3新模型斩获1433分,超越顶尖闭源模型Grok4、Claude4,位列所有闭源及开源模型的全球总榜第三。同时,千问3还夺得数学、代码、复杂提示、长文本检索、指令遵循等5项全球第一。

全球知名ChatBot Arena大模型排行榜,千问3位列全球顶级模型第三、开源第一(受访者供图)

Chatbot Arena是由独立研究机构LMSYS Org推出的大模型评测平台,其评测分数被认为是全球最具公信力的大模型榜单。

不到一年前,Qwen2.5-72B是第一个入选该榜前十的中国大模型;上周开源的千问3非思考基础模型 Qwen3-235B-A22B-Instruct-2507 再次实现重大突破,揽获5项关键能力全球第一,并以1433分的总分创下开源大模型的史上最高分,力压Grok4、Claude4、Gemini 2.5-Flash、GPT4.1等一众顶级闭源模型,千问3与GPT4.5并列全球第三。

千问3在数学、代码、复杂提示、长文本、指令遵循等方面位列全球第一(受访者供图)

7月22日起,阿里通义团队接连开源千问3基础模型、AI编程模型和推理模型,性能均实现同类开源模型的新突破。除千问3 指令(Instruct)模型外,推理模型 Qwen3-235B-A22B-Thinking-2507 也闯进榜单前十,数学能力并列全球第一;在Chatbot Arena专门评估编程能力的WebDevArena子榜单中,编程模型Qwen3-Coder性能与Gemini2.5 Pro、『DeepSeek』-R1、Claude4并列第一。

通义模型(受访者供图)

本周,『通义千问』仍在以“周级迭代”频率持续更新:Qwen3-30B-A3B 更新了Instruct模型、推理模型、编程模型等3款模型,性能媲美Gemini2.5-flash、GPT-4o,可在消费级硬件直接部署,广受开发者欢迎。

同时,千问3新模型的“训练秘籍”GSPO新算法也对外公开,GSPO从根源上解决了大规模MoE模型在强化学习中的稳定性问题,训练效率较经典GRPO算法实现大幅提升,GSPO论文在全球最大的AI开源社区HuggingFace里论文热度排名第一。

阿里千问模型API调用量市场份额超10.9%,位列全球第四(受访者供图)

阿里AI多连发,在全球范围内引发新一轮接入中国开源模型热潮。

海外大模型API聚合平台OpenRouter数据显示,阿里千问模型全球市场份额逾10.9%,超越OpenAI和Meta-Llama系列模型,位列全球第四;其中,Qwen3-Coder调用量一周暴增1474%,位列编程领域的全球第二。

编程领域中,Qwen3-Coder尤受AI社区欢迎,API调用量一周暴增1474%(受访者供图)

截至目前,阿里已开源300余个模型,持续推进“全尺寸”、“全模态”的全面开源。『通义千问』衍生模型已超过14万个,是全球第一的开源模型,也是中国企业用得最多的大模型。

未来三年,阿里巴巴还将投入3800亿元在AI和云基础设施建设上,夯实“AI全栈”的技术体系和战略布局,为全球开发者和企业提供更高性能、更普惠的AI和云计算服务。

特别声明:[开源大模型得分新纪录!阿里千问3性能全球第三(开源模拟)] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

合肥通用机械研究院申请高温多级泵轴向力平衡结构专利,提高多级泵在高温环境下的液力性能(合肥通用机械厂)

国家知识产权局信息显示,合肥通用机械研究院有限公司;浙江理工大学;通用机械关键核心基础件创新中心(安徽)有限公司申请一项名为“一种高温多级泵的轴向力平衡结构”的专利,公开号CN121382694A,申请日期为…

合肥通用机械研究院申请高温多级泵轴向力平衡结构专利,提高多级泵在高温环境下的液力性能(合肥通用机械厂)

美瑞克RK9920-4C8C多路程控耐压绝缘测试仪的电弧侦测功能有什么用?2026年的电气安全检测新趋势(美瑞克仪器官网)

美瑞克RK9920-4C8C是一款专为电力电子设备设计的多功能绝缘测试仪。其突出的电弧侦测功能,能够在高电压环境下及时发现安全隐患。本文深入剖析其应用场景、关键技术指标,帮助您选择最适合的配置方案。特别适用于追求更高电气安全性和测试效率的

美瑞克RK9920-4C8C多路程控耐压绝缘测试仪的电弧侦测功能有什么用?2026年的电气安全检测新趋势(美瑞克仪器官网)

冰激凌萝卜礼盒装真的那么神奇吗?2026年必买生鲜好物推荐 🌟(冰激凌免费送)

近年来,冰淇淋萝卜这一新奇美食悄然走红。2026年,礼盒装的新鲜现水果萝卜更是成为生鲜界的『网红爆款』。本文深入解析这款神奇的果蔬礼盒背后的故事,帮您了解其营养价值、新鲜程度和选购技巧,让您可以轻松选择适合的产品,提升日常饮食体验。无论是追求品

冰激凌萝卜礼盒装真的那么神奇吗?2026年必买生鲜好物推荐 🌟(冰激凌免费送)

晚风织尽旧时恨》许雾眠周寂川秦笙跟周寂川结婚的第三年,许雾眠在拍卖会撞见了周寂川和他们曾经的“挡箭牌”。 也是整(晚风feng)

他半跪在许雾眠面前,握住她的手,轻声开口:“眠眠,我跟秦笙真的没有什么,跟她一起出现在拍卖会也真的是在给妈挑礼物🎁,顺便......补偿她给我们做挡箭牌,你别不开心。” 帖子以许雾眠的口吻承认了是她嫉妒心重,…

《<strong>晚风织尽旧时恨</strong>》许雾眠周寂川秦笙跟周寂川结婚的第三年,许雾眠在拍卖会撞见了周寂川和他们曾经的“挡箭牌”。 也是整(晚风feng)

一则“末日警告⚠️”全网发酵:“8月12日地球会失重引发末日?” 科学家辟谣

近期,一则末日警告⚠️引爆全网:时间锁定在2026年8月12日14点33分日全食之时,说是黑洞并合产生的引力波,会引发一场持续7.3秒的全球重力异常,预计造成4000万人伤亡,美国NASA还悄悄砸了890亿美元💵…

一则“末日警告⚠️”全网发酵:“8月12日地球会失重引发末日?” 科学家辟谣