通义Qwen3开源新推理模型:数学超强、代码贼溜,上下文可拓展至100万

通义Qwen3开源新推理模型:数学超强、代码贼溜,上下文可拓展至100万

凤凰网科技讯 7月31日,通义千问团队在公众平台发布消息,Qwen3-30B实现重大升级,全新推理模型Qwen3-30B-A3B-Thinking-2507正式发布。新模型拓展了思考能力,提升了推理的质量和深度,是一个更睿智、更敏捷、更全能的新推理模型。

新模型在推理能力、通用能力及上下文长度上有了显著提升,新模型在聚焦数学能力的AIME25评测中获85.0分,在代码能力测试LiveCodeBench v6中得分66.0,两项核心推理能力均超越Gemini2.5-Flash(thinking)、Qwen3-235B-A22B(thinking);新模型的知识水平(GPQA、MMLU-Pro)也较上一版本进步显著;在写作(WritingBench)、Agent能力(BFCL-v3)、多轮对话和多语言指令遵循(MultiIF)等通用能力评测中,Qwen3-30B-A3B-Thinking-2507均超越Gemini2.5-Flash(thinking)、Qwen3-235B-A22B(thinking);原生支持256K tokens,可扩展至1M tokens。

值得一提的是,新模型的思考长度增加,团队建议在处理高度复杂的推理任务时,设置更长的思考预算,可以充分发挥新模型潜力。

目前Qwen3-30B-A3B-Thinking-2507已在魔搭社区、HuggingFace上开源,Qwen Chat同步上线。

特别声明:[通义Qwen3开源新推理模型:数学超强、代码贼溜,上下文可拓展至100万] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

剃须刀哪款好用性价比最高?市面上5款主流剃须刀推荐,公认好用(剃须刀哪款好用性价比最高)

很多产品内部结构设计精密,性能衰减度高,对转速的影响也非常大,内部结构设计低劣的产品,可能用着用着就不转不动了,导致刀片的转速下降,在剃须中不仅刮剃不干净、残留多,还会刮的皮肤出血,加大对皮肤的刺激。希望大…

剃须刀哪款好用性价比最高?市面上5款主流剃须刀推荐,公认好用(剃须刀哪款好用性价比最高)

叶童亮相青年电影展,一袭红裙惊艳全场,裸露后背肌肉线条太美(叶童2025年活动)

她于1963年在香港诞生,年满十九便因电影《烈火青春》而获得金像奖最佳新人提名,这一朝代开启了她的星光之路。此后,她又在《倚天屠龙记》中演绎了亦正亦邪的赵敏,在《和平饭店》中则展现了包含千种风情的老板娘,这些…

叶童亮相青年电影展,一袭红裙惊艳全场,裸露后背肌肉线条太美(叶童2025年活动)

发现自贸港 | 硬核!揭秘你不知道的海南防台风“黑科技”(自贸港 知乎)

今年,多项“黑科技”在我省投用:除了海洋无人风帆航行器与台风共舞,在文昌沿海,无人船在距离台风眼100海里的位置“陪跑”;在三亚近海,一座近百米高的海上测试平台严阵以待……这些“黑科技”加持,让海南获得了详…

发现自贸港 | 硬核!揭秘你不知道的海南防台风“黑科技”(自贸港 知乎)

震惊!你的聊天方式已悄然改变,影响每一个人(你震惊了我的英语)

这或许也是零零后群体更愿封闭自我的原因所在,他们自幼便生活在资讯传媒时代,资讯与信息触手可及,以至于与家人交流都依赖手机,而拙于当面沟通。往昔以文字与语言交流,能让我们更加聪慧睿智;反观当下,我们却沦为视频与…

震惊!你的聊天方式已悄然改变,影响每一个人(你震惊了我的英语)

世上渣男千千万,最怕汪峰这种!现在才发现章子怡是那个“输家”(世间渣男)

丰富的感情经历汪峰的第一任妻子是四川某电视台的主持人齐丹,当时两人一见钟情,汪峰在3天内俘获了美人芳心。2004年,已经在北京漂泊了3年的葛荟婕结识了比她大16岁的汪峰,随后二人相恋。 被葛荟婕曝渣男虽然…

世上渣男千千万,最怕汪峰这种!现在才发现章子怡是那个“输家”(世间渣男)