性能比肩『DeepSeek』,阿里开源最新推理模型发布即爆火

阿里再度推进开源进程。3月6日,阿里凌晨发布并开源『通义千问』推理模型QwQ-32B。据悉,千问QwQ-32B在数学、代码及通用能力上实现质的飞跃,用更小参数实现整体性能比肩『DeepSeek』-R1,并突破性地让高性能推理模型在消费级显卡上实现本地部署,大幅降低了模型应用成本。随后,千问推理模型QwQ-32B迅速登顶全球最大的AI开源社区Hugging Face大模型榜单。

今日霍州(www.jrhz.info)©️

据悉,阿里还在推理模型中集成了与Agent相关的能力,使其能够在使用工具的同时进行批判性思考,并根据环境反馈调整推理过程。同时,阿里还开展了大规模强化学习。“在初始阶段,特别针对数学和编程任务进行了大规模强化学习训练。与依赖传统的奖励模型(reward model)不同,我们通过校验生成答案的正确性来为数学问题提供反馈,并通过代码执行『服务器』评估生成的代码是否成功通过测试用例来提供代码的反馈。”『通义千问』团队称。

最近,针对开源阿里方面动作频频。就在2月25日晚,阿里云深夜抢先开源旗下视觉生成基座模型万相2.1(Wan)。阿里云该开源产品采用最宽松的Apache2.0协议,14B和1.3B两个参数规格的全部推理代码和权重全部开源,同时支持文生视频和图生视频任务,在权威测评中,万相2.1也已经超越了Sora、Luma、Pika等国内外模型。

另外在2月25日日间,阿里Qwen团队在『社交媒体』宣布发布新推理模型——深度思考(QwQ)。据介绍,该新推理模型基于Qwen2.5-Max的推理模型,目前的模型为预览版,已具有很强的数学理解、编码、代理等能力,目前支持有深度思考(QWQ)和联网搜索,同时布局了多模态能力,能根据提示语句生成图片。

自2023年8月起,阿里云相继开源Qwen、Qwen1.5、Qwen2等多代模型,囊括了0.5B、1.5B、3B、7B、14B、32B、72B、110B等全尺寸,大语言、多模态、数学和代码等全模态。根据全球最大AI开源社区Hugging Face信息,截至目前,阿里千问(Qwen)开源大模型的衍生模型数量已突破10万。

采写:南都记者 林文琪

特别声明:[性能比肩『DeepSeek』,阿里开源最新推理模型发布即爆火] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

年轻漂亮的继母》:从抗拒到依赖,亲情从不止一种模样(年轻漂亮的意思)

尽管金相贤的家庭情况比较复杂,但李恩书并没有因此而退缩,她相信自己可以给这个家庭带来更多的温暖和快乐,于是她毫不犹豫地嫁给了金相贤,成为了他的第三任妻子,也成为了两个孩子的继母。 正如《年轻漂亮的继母》所展…

《<strong>年轻漂亮的继母</strong>》:从抗拒到依赖,亲情从不止一种模样(年轻漂亮的意思)

太突然!著名女演员家中去世!(知名女演员突然)

凯瑟琳·奥哈拉所属经纪公司发声明称,她于当地时间30日在家中因病去世。消息来得相当突然,奥哈拉近年仍很活跃,她在《片厂风云》的演绎本届颁奖季频获奖项提名,如今该剧第二季刚开拍。 《小鬼当家》主演、在片中与…

太突然!著名女演员家中去世!(知名女演员突然)

别再瞎刷手机了!中医提醒:每天刷1小时以上,气血正在悄悄溜走,越刷越没精神(刷手机有什么风险)

如今,刷手机已成为现代人的日常习惯。无论是早晨起床、通勤途中还是睡前,人们总是在刷手机,甚至在碎片时间也不愿放过。我们通常认为刷手机是放松消遣的方式,但中医认为这种行为实际上在悄悄消耗身体的气血

别再瞎刷手机了!中医提醒:每天刷1小时以上,气血正在悄悄溜走,越刷越没精神(刷手机有什么风险)

『刘晓庆』回应“8个男友”传闻 幽默化解情感谣言

75岁的『刘晓庆』在最新综艺《主咖和Ta的朋友们》中再次语出惊人,对流传已久的“八个男友”传闻毫不避讳地回应,引发现场一阵笑声,也在网络上引起热议

『刘晓庆』回应“8个男友”传闻 幽默化解情感谣言

科技生活方式品牌PITAKA携手MÜNN登陆2026首尔『时装周』(科技生活方式品牌有哪些)

每年春季,时尚圈总会涌现出不少热门话题与新鲜动态,备受各界关注。2月3日-8日,2026首尔『时装周』在韩国首尔DPP举行,作为开幕日的重头戏,韩国『『设计师』品牌』MÜNN延续品牌标志性的“陌生化”设计语言,以军装元素…

科技生活方式品牌PITAKA携手MÜNN登陆2026首尔『时装周』(科技生活方式品牌有哪些)