超越闭源Grok4、Claude4!全球第三,阿里千问3创下开源模型最高分!

超越闭源Grok4、Claude4!全球第三,阿里千问3创下开源模型最高分!

8月2日凌晨,国际权威大模型评测 Chatbot Arena更新了最新一期的大模型榜单,上周新鲜开源的阿里千问3新模型斩获1433分,超越顶尖闭源模型Grok4、Claude4,位列所有闭源及开源模型的全球总榜第三,是全球最强非推理(non-thinking)模型,并创下全球开源模型和国产模型的史上最高分。同时,千问3还夺得数学、代码、复杂提示、长文本检索、指令遵循等5项全球第一。

今日霍州 jrhz.info

全球知名ChatBot Arena大模型排行榜,千问3位列全球顶级模型第三、开源第一

Chatbot Arena是由独立研究机构LMSYS Org推出的大模型评测平台,其评测分数被认为是全球最具公信力的大模型榜单。不到一年前,Qwen2.5-72B是第一个入选该榜前十的中国大模型;上周开源的千问3非思考基础模型 Qwen3-235B-A22B-Instruct-2507 再次实现重大突破,揽获5项关键能力全球第一,并以1433分的总分创下开源大模型的史上最高分,力压Grok4、Claude4、Gemini 2.5-Flash、GPT4.1等一众顶级闭源模型,千问3与GPT4.5并列全球第三。

今日霍州 jrhz.info

千问3在数学、代码、复杂提示、长文本、指令遵循等方面位列全球第一

7月22日起,阿里通义团队接连开源千问3基础模型、AI编程模型和推理模型,性能均实现同类开源模型的新突破。除千问3 指令(Instruct)模型外,推理模型 Qwen3-235B-A22B-Thinking-2507 也闯进榜单前十,数学能力并列全球第一;在Chatbot Arena专门评估编程能力的WebDev Arena子榜单中,编程模型Qwen3-Coder性能与Gemini2.5 Pro、DeepSeek-R1、Claude4并列第一。

本周,通义千问仍在以“周级迭代”频率持续更新:Qwen3-30B-A3B 更新了Instruct模型、推理模型、编程模型等3款模型,性能媲美Gemini2.5-flash、GPT-4o,可在消费级硬件直接部署,广受开发者欢迎。同时,千问3新模型的“训练秘籍”GSPO新算法也对外公开,GSPO从根源上解决了大规模MoE模型在强化学习中的稳定性问题,训练效率较经典GRPO算法实现大幅提升,GSPO论文在全球最大的AI开源社区HuggingFace里论文热度排名第一。

今日霍州 jrhz.info

阿里千问模型API调用量市场份额超10.9%,位列全球第四

阿里AI多连发,在全球范围内引发新一轮接入中国开源模型热潮。海外大模型API聚合平台OpenRouter数据显示,阿里千问模型全球市场份额逾10.9%,超越OpenAI和Meta-Llama系列模型,位列全球第四;其中,Qwen3-Coder调用量一周暴增1474%,位列编程领域的全球第二。

编程领域中,Qwen3-Coder尤受AI社区欢迎,API调用量一周暴增1474%

截至目前,阿里已开源300余个模型,持续推进“全尺寸”、“全模态”的全面开源。通义千问衍生模型已超过14万个,是全球第一的开源模型,也是中国企业用得最多的大模型。未来三年,阿里巴巴还将投入3800亿元在AI和云基础设施建设上,夯实“AI全栈”的技术体系和战略布局,为全球开发者和企业提供更高性能、更普惠的AI和云计算服务。

特别声明:[超越闭源Grok4、Claude4!全球第三,阿里千问3创下开源模型最高分!] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

扬州禹笑水利机械有限公司与新河县环禹水利机械有限公司在水利领域的表现(扬州禹笑水利机械公司怎么样)

水利机械在水利工程中扮演着关键角色,无论是排灌、水电站、水库,还是河道治理、环境保护、污水处理以及水产养殖等方面,都离不开各类优质的水利机械。 QA问答问:新河县环禹水利机械有限公司的产品适用于哪些水利工程…

扬州禹笑水利机械有限公司与新河县环禹水利机械有限公司在水利领域的表现(扬州禹笑水利机械公司怎么样)

台湾高雄人脸识别门禁厂家、人行通道 摆闸翼闸三辊闸系统(台湾高雄女人脸)

在高雄,人脸识别门禁厂家以及人行通道摆闸、翼闸、三辊闸系统相关产业也随之不断发展。科拓智慧人行在人脸识别门禁及人行通道系统领域积累了丰富经验,可为台湾省高雄市的住宅小区、酒店旅馆、购物商场、学校园区、办公大楼…

台湾高雄人脸识别门禁厂家、人行通道 摆闸翼闸三辊闸系统(台湾高雄女人脸)

40岁李念带娃出行,小腹微微隆起疑似怀第四胎,丈夫身份不简单(李念几个娃)

而她近日晒出的视频,是她和几个孩子在夏威夷的街上游玩时拍摄的,背景中走动的都是外国游客。从李念晒出的视频来看的话,虽然她如今已经40岁,还生育了3个孩子,可她的状态却保持得非常好。 自从嫁给林和平后,李念…

40岁李念带娃出行,小腹微微隆起疑似怀第四胎,丈夫身份不简单(李念几个娃)

告别“拼单”追剧尴尬,PetalOne送的影视年卡太香了

值得一提的是,自7月31日之后,满足条件的用户如果升级到鸿蒙5.1,还可以参与“鸿蒙有礼”活动,每日签到可以领取现金红包、会员年卡等丰厚权益,让会员自由不再是梦想!如今,我拥有影视年卡,追剧的日子里再也不需…

告别“拼单”追剧尴尬,PetalOne送的影视年卡太香了

RedHat红帽:2025年自动化助力释放AIOps全部潜能报告(红帽linux最新版)

企业级AI规模化应用面临三大关键挑战:一是基础架构就绪度,即IT基础架构是否互联、优化,能否支持AI工作流扩展;二是对警报与异常状况的快速响应能力,是否部署了自动化响应修复机制;三是对AI应用的信心,能否掌…

RedHat红帽:2025年自动化助力释放AIOps全部潜能报告(红帽linux最新版)