性能比肩DeepSeek,阿里开源最新推理模型发布即爆火

性能比肩DeepSeek,阿里开源最新推理模型发布即爆火

阿里再度推进开源进程。3月6日,阿里凌晨发布并开源通义千问推理模型QwQ-32B。据悉,千问QwQ-32B在数学、代码及通用能力上实现质的飞跃,用更小参数实现整体性能比肩DeepSeek-R1,并突破性地让高性能推理模型在消费级显卡上实现本地部署,大幅降低了模型应用成本。随后,千问推理模型QwQ-32B迅速登顶全球最大的AI开源社区Hugging Face大模型榜单。

据悉,阿里还在推理模型中集成了与Agent相关的能力,使其能够在使用工具的同时进行批判性思考,并根据环境反馈调整推理过程。同时,阿里还开展了大规模强化学习。“在初始阶段,特别针对数学和编程任务进行了大规模强化学习训练。与依赖传统的奖励模型(reward model)不同,我们通过校验生成答案的正确性来为数学问题提供反馈,并通过代码执行服务器评估生成的代码是否成功通过测试用例来提供代码的反馈。”通义千问团队称。

最近,针对开源阿里方面动作频频。就在2月25日晚,阿里云深夜抢先开源旗下视觉生成基座模型万相2.1(Wan)。阿里云该开源产品采用最宽松的Apache2.0协议,14B和1.3B两个参数规格的全部推理代码和权重全部开源,同时支持文生视频和图生视频任务,在权威测评中,万相2.1也已经超越了Sora、Luma、Pika等国内外模型。

另外在2月25日日间,阿里Qwen团队在社交媒体宣布发布新推理模型——深度思考(QwQ)。据介绍,该新推理模型基于Qwen2.5-Max的推理模型,目前的模型为预览版,已具有很强的数学理解、编码、代理等能力,目前支持有深度思考(QWQ)和联网搜索,同时布局了多模态能力,能根据提示语句生成图片。

自2023年8月起,阿里云相继开源Qwen、Qwen1.5、Qwen2等多代模型,囊括了0.5B、1.5B、3B、7B、14B、32B、72B、110B等全尺寸,大语言、多模态、数学和代码等全模态。根据全球最大AI开源社区Hugging Face信息,截至目前,阿里千问(Qwen)开源大模型的衍生模型数量已突破10万。

采写:南都记者 林文琪

特别声明:[性能比肩DeepSeek,阿里开源最新推理模型发布即爆火] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

湖人重启‘加州梦’球衣:卢卡·东契奇领衔新时代(加州湖人队)

‘加州梦’球衣的设计元素融合了湖人队的历史与文化,使其成为球迷和球队之间的情感纽带。东契奇穿着‘加州梦’球衣进入新赛季,成为这一象征性球衣的代言人,也让球迷对湖人队的未来充满期待。通过重新启用这款球衣,湖人…

湖人重启‘加州梦’球衣:卢卡·东契奇领衔新时代(加州湖人队)

张一山年少成名,似成下一个“文章”,一步错步步错,争议不断(张一山从小到大)

更有媒体爆料,张一山曾与一名男子亲密互动,并曝出他随地小便、乱丢烟蒂等不雅行为,这一切都对他的形象造成了严重损害,也让他的职业生涯陷入了低谷。在马伊琍怀二胎时,文章却与姚笛曝出婚外情,两人亲密的照片迅速被媒体…

张一山年少成名,似成下一个“文章”,一步错步步错,争议不断(张一山从小到大)

宋佳私生活传闻离谱:陪睡上位、与五婚导演恋爱,知三当三?(宋佳 2)

这一昵称给她初入娱乐圈时带来了不少困扰,甚至有朋友建议她改个名字,以便在演艺圈中闯出一片天地。尽管这部电影因其大胆的裸体戏份和性感角色为她贴上了“性感欲女”的标签,但正是她精湛的演技让这个标签在很长一段时间里…

宋佳私生活传闻离谱:陪睡上位、与五婚导演恋爱,知三当三?(宋佳 2)

电风扇品牌前十强实测报告,手把手教你怎么选不踩雷!(电风扇品牌前十名(制冷))

此次精选电风扇品牌前十名,展开全方位硬核实测,从风速、噪音、能耗到智能功能逐一考量,用专业数据为你答疑,助你精准选到适配需求的优质电风扇。这款电风扇前十名测评数据,用轻柔风力拂去燥热,静音设计守护安睡,智能定…

电风扇品牌前十强实测报告,手把手教你怎么选不踩雷!(电风扇品牌前十名(制冷))

联想拯救者Y7000P:电竞与生产力的完美平衡之选(联想拯救者y7000p值得买吗)

拯救者Y7000P的16英寸大屏用三项黑科技化解了这些痛点:2560x1600分辨率让矢量图形的边缘锐利如刀刻,DC调光+莱茵护眼认证把频闪伤害降到最低,而ΔE<2的专业级色准,甚至能让摄影师放心地用它做后期…

联想拯救者Y7000P:电竞与生产力的完美平衡之选(联想拯救者y7000p值得买吗)