权威榜单发布,全球开源大模型前十均为阿里通义千问衍生模型

权威榜单发布,全球开源大模型前十均为阿里通义千问衍生模型

央广网北京2月10日消息 近日,全球最大AI开源社区Huggingface发布了最新的开源大模型榜单(Open LLM Leaderboard),榜单显示,其排名前十的开源大模型全部是基于阿里通义千问(Qwen)开源模型二次训练的衍生模型。该榜单是目前全球最具权威性的开源大模型榜单,其测试维度涵盖阅读理解、逻辑推理、数学计算、事实问答等。

(图源 Huggingface2月10日官网榜单截图)

通义千问Qwen大模型已经成为全球最大的开源模型族群。在海内外开源社区中,Qwen的衍生模型数量已突破9万,超越美国Meta公司旗下的Llama系列开源模型,位居全球第一。在Hugging face2024年的开源模型下载中,Qwen模型系列中的Qwen2.5-1.5B-Instruct的下载量占总下载量的26.6%,是全球下载量最高的开源模型。在这一轮推理模型技术浪潮中,Qwen系列模型广受欢迎。此前爆火的DeepSeek公司基于R1推理模型蒸馏了6个模型开源给社区,其中有4个模型来自Qwen。近期,著名AI科学家李飞飞团队用较少的资源和数据训练出的s1推理模型同样以Qwen模型为基础模型。国内外开发者认为,以上模型取得的良好成绩跟基础模型的强大性能有很大关系。

从2023年8月起,阿里云通义千问相继开源Qwen、Qwen1.5、Qwen2、Qwen2.5等4代模型,囊括大语言模型、多模态模型、数学模型和代码模型等数十款,多次登上国内外权威大模型榜单,已成为开源社区最重要的模型系列。

特别声明:[权威榜单发布,全球开源大模型前十均为阿里通义千问衍生模型] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

《你好时光》暴露嘉宾综艺感:装傻充愣,智商跟不上,情商堪忧(你好时光2025综艺)

分不清主次,看得让人心急,而且在查了小岳岳的身份之后,还在怀疑小岳岳,真不知道是咋想的,看着气死人了,那她这警察当着是干嘛的呢? 一上来就装无辜,更票其他人头了沙溢,沙溢作为平民自然是不服气,而且在加上前面…

《你好时光》暴露嘉宾综艺感:装傻充愣,智商跟不上,情商堪忧(你好时光2025综艺)

在AI顶级学术会议ACL2025上,DeepSeek 提出的稀疏注意力机制获得最佳论文奖!

A:NSA主要有三大优势:首先是显著的速度提升,在64k长度序列处理中实现了11.6倍的解码加速、9.0倍的前向加速和6.0倍的后向加速;其次是端到端可训练性,从预训练开始就采用稀疏模式,让模型学会最优的注…

在AI顶级学术会议ACL2025上,DeepSeek 提出的稀疏注意力机制获得最佳论文奖!

特朗普关税战再升级 全球贸易格局重塑(特朗普调高5500亿关税)

当地时间7月31日晚上(北京时间8月1日早上),特朗普在关税磋商期限前夕宣布对数十个贸易伙伴实施高额关税。加拿大商品被课以35%关税,巴西高达50%,印度25%,瑞士39%,而墨西哥则获得90天暂缓加征关税的“喘息期”

特朗普关税战再升级 全球贸易格局重塑(特朗普调高5500亿关税)

依必安派特申请冷却式空气动力轴向轴承专利,用于轴向支承沿涡轮压缩机旋转轴线延伸的轴(依必安派特临潼)

金融界2025年8月2日消息,国家知识产权局信息显示,依必安派特穆尔芬根有限两合公司申请一项名为“冷却式空气动力轴向轴承和带有这种轴向轴承的涡轮压缩机”的专利,公开号CN120402523A,申请日期为202…

依必安派特申请冷却式空气动力轴向轴承专利,用于轴向支承沿涡轮压缩机旋转轴线延伸的轴(依必安派特临潼)

洗面奶什么牌子好?揭秘年度最佳:万千女性的心头好的洗面奶(洗面奶什么牌子清洁效果好)

它纳米级别的泡沫能深入毛孔,把脏东西都带出来,冲洗之后感觉整个毛孔都在畅快呼吸,整张脸干净又清爽,摸起来滑溜溜的,真的太舒服了! 它是一款很经典的皂基洁面,奶油色膏状质地带有微细小颗粒,能吸附毛孔中的污染物同…

洗面奶什么牌子好?揭秘年度最佳:万千女性的心头好的洗面奶(洗面奶什么牌子清洁效果好)