通义Qwen3开源新推理模型:数学超强、代码贼溜,上下文可拓展至100万

凤凰网科技讯 7月31日,『通义千问』团队在公众平台发布消息,Qwen3-30B实现重大升级,全新推理模型Qwen3-30B-A3B-Thinking-2507正式发布。新模型拓展了思考能力,提升了推理的质量和深度,是一个更睿智、更敏捷、更全能的新推理模型。

今日霍州(www.jrhz.info)©️

新模型在推理能力、通用能力及上下文长度上有了显著提升,新模型在聚焦数学能力的AIME25评测中获85.0分,在代码能力测试LiveCodeBench v6中得分66.0,两项核心推理能力均超越Gemini2.5-Flash(thinking)、Qwen3-235B-A22B(thinking);新模型的知识水平(GPQA、MMLU-Pro)也较上一版本进步显著;在写作(WritingBench)、Agent能力(BFCL-v3)、多轮对话和多语言指令遵循(MultiIF)等通用能力评测中,Qwen3-30B-A3B-Thinking-2507均超越Gemini2.5-Flash(thinking)、Qwen3-235B-A22B(thinking);原生支持256K tokens,可扩展至1M tokens。

今日霍州(www.jrhz.info)©️

值得一提的是,新模型的思考长度增加,团队建议在处理高度复杂的推理任务时,设置更长的思考预算,可以充分发挥新模型潜力。

目前Qwen3-30B-A3B-Thinking-2507已在魔搭社区、HuggingFace上开源,Qwen Chat同步上线。

特别声明:[通义Qwen3开源新推理模型:数学超强、代码贼溜,上下文可拓展至100万] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

这档『明星』️光脚秀:无人敢与『王楚然』同框,无人敢和曹骏拼扮嫩(『明星』️光脚参加的节目)

说到易梦玲,她每次的造型都给人一种新鲜感,而这一次,她的『妆容』和造型简直可以说是内娱的换新颜。钟楚曦则是一种美得千变万化的魅力,她看起来不费力就透着时尚感,仿佛天生就有那股子洋气,简直是自然流露的『明星』️气质。她的…

这档『明星』️光脚秀:无人敢与『王楚然』同框,无人敢和曹骏拼扮嫩(『明星』️光脚参加的节目)

海外看电视地区限制怎么办?简单三步解决困扰(海外看电视地区怎么看)

别急,今天我来分享一个实用解决方案——"番茄加速器",它能一键优化网络路由,让你轻松解锁大陆服务,告别延迟和区域限制。最靠谱的方法是使用网络优化工具,它们能伪造你的虚拟位置,让系统误以为你在国内。 总结一

海外看电视地区限制怎么办?简单三步解决困扰(海外看电视地区怎么看)

古风汉服一家,尽显东方雅韵!(古风汉服穿法)

古风汉服一家,尽显东方雅韵!(古风汉服穿法)

二手机械式停车库的工作原理主要包括(二手停车收费设备)

它的核心驱动依靠由电机、减速机、链条或者钢丝绳构成的传动系统,电机给予动力,借助减速机增大扭矩并降低转速,接着通过链条 or 钢丝绳把动力传至载车板,达成升降或者横移动作,对于二手设备而言,这一整套传动…

二手机械式停车库的工作原理主要包括(二手停车收费设备)

颚式破碎机-粒度均匀、有助于二段破碎处理(颚式细碎破碎机)

该设备的进料粒度高达1500mm,可以吃下大石头,所以常用来作为粗碎机使用,时产1-2200吨,可对花岗岩、石灰石、河卵石、玄武岩等200多种物料进行破碎,广泛应用于建筑、冶金、矿山、道路、水电等多个行业。 …

颚式破碎机-粒度均匀、有助于二段破碎处理(颚式细碎破碎机)