行业观察|85天两次重大迭代,阿里大模型为什么死磕全球速度?(行业观察报告)

行业观察|85天两次重大迭代,阿里大模型为什么死磕全球速度?(行业观察报告)

全球主流基础大模型厂商现阶段比拼的是能力迭代速度。大模型能力快速进化,正在成为影响阿里云业绩,甚至影响投资者重估阿里集团的重要“砝码”

文|吴俊宇

编辑|谢丽容

阿里2025年进入大模型竞速模式。通义千问(Qwen)系列模型发布、更新节奏正在加快。

阿里7月22日-25日接连发布、更新四款模型:其中包括两款基础模型——

Qwen3-235B-A22B-2507-Instruct-2507(基础模型,非推理版)、Qwen3-235B-A22B-Thinking-2507(基础模型,推理版),两款垂直领域的模型——Qwen3-Coder(编程模型)、Qwen-MT(机器翻译模型)。

这四款模型中的两款基础模型备受瞩目——今年4月29日,阿里Qwen 3系列模型首次发布。Qwen 3这次基础模型更新,距最初发布只过去85天。对比上一代Qwen 2.5系列的132天(2024年9月19日发布,2025年1月29日更新Qwen 2.5 Max),Qwen 3更新周期大幅缩短。

阿里的基础模型更新周期越来越短。阿里Qwen 3基础模型更新速度,甚至不逊色于全球知名大模型,目前仅次于谷歌的Gemini 2.5系列——xAI的Grok 3到Grok 4,更新周期142天;OpenAI的o1到o3,更新周期132天;DeepSeek-R1两个版本,更新周期128天;DeepSeek-V3两个版本,更新周期87天;谷歌Gemini 2.5两个版本,更新周期仅42天。

2025年,全球科技公司的大模型迭代速度都越来越快。据我们的不完全统计,2025年1月1日-7月25日的206天内,中美参与模型竞争的11家科技公司(包括阿里、字节跳动、腾讯、百度、华为、DeepSeek、月之暗面、谷歌、OpenAI、Anthropic、xAI)发布或迭代了至少29版大模型,平均每7.1天就会有一版新的大模型被发布。

大模型的竞争如此激烈。它正在成为决定阿里云的业绩,甚至决定投资者看待阿里集团的重要“砝码”——这是阿里Qwen系列模型为什么要提速奔跑的重要原因。

跑赢大模型迭代赛

阿里集团管理层对阿里通义系列大模型的要求是——必须跑赢大模型的竞速,其中不仅技术指标要领先,商业落地也要领先。

大模型迭代速度极快,几乎每三四个月,领先的模型就可能被赶超。每当国内出现一款性能领先的模型时,阿里通义团队都会在短时间内迭代模型,重新确保领跑市场。

今年初DeepSeek-R1爆火后,通义团队在春节期间一周迭代了三款大模型。一位阿里云高管5月曾对我们直言,DeepSeek-R1出现后,阿里云管理层在内部讨论时提到,一定要有跟竞争对手相当或者超越的模型。

今年7月,全球大模型的性能迭代进入新周期——xAI旗下的Grok 4、月之暗面的K2接连发布,它们提升了模型的性能上限。阿里Qwen 3这一轮迭代可以确保自身维持领先。

阿里云CTO、通义实验室负责人周靖人今年6月在魔搭开发者大会群访环节曾对我们表示,通义实验室的核心团队成员,一直将追踪研判全球前沿技术动态视为日常工作的一部分。他们不仅会关注人工智能顶会(AAAI、IJCAI、ICML、NIPS等顶级国际学术会议)的论文,还会密切跟踪全球各大开源社区、技术博客以及头部AI公司的产品发布。

通义实验室团队有着自由探索但又目标明确的学术氛围。一位通义人士今年6月曾对我们提到,通义实验室团队内部有常态化的论文分享会和技术研讨机制,鼓励团队成员钻研技术细节,并从第一性原理出发去思考其背后的创新点和潜在价值。

大模型领域,几乎每个月都有技术突破,每周都有大量学术论文被发表。如何在技术洪流中去伪存真,识别出真正具备长期价值的技术方向?

周靖人在今年6月曾对我们解释,团队通常会从几个维度综合评估——它带来的性能提升是微小的、渐进式的,还是指数级的、颠覆性的?能否以更低的计算成本、更少的参数量,达到甚至超越现有技术的性能?是否具有良好的可扩展性,可应用于更大规模的模型和更广泛的场景?能否提供完善工具链,让开发者便捷地进行实验和创新?

通义实验室今年至少有三个目标。一是模型性能、下载量、衍生模型数量都要领先;二是要渗透更多商业应用场景;三是2025年通义模型日均调用量要更快增长。

这三个目标正有条不紊地实现。阿里的Qwen 3系列模型性能,始终紧紧咬住OpenAI、谷歌Gemini等国际领先的旗舰模型。开源生态则和Meta的Llama系列模型互有胜负。

国际市场调研机构Artificial Analysis长期对全球主流模型进行性能基准测试,并对全球模型价格、吞吐效率等指标进行排名。阿里Qwen 3 235B-A22B(4月29日版推理模型)性能仅次于OpenAI o3、谷歌Gemini 2.5 Pro这两款全球领先的旗舰模型。Qwen 3-235B-A22B的价格则有一定的优势。

此次更新之后,Qwen系列模型的性能又有所提升。阿里通义大模型官方公布的基准测试显示,本周更新的四款模型——Qwen3-235B-A22B两款基础模型、Qwen3-Coder(编程模型)、Qwen-MT(机器翻译模型)不输全球旗舰模型。

性能领先、价格合理,这使得Qwen系列模型的开源生态、商业落地取得了明显的进展。

开源模型任何人都能下载、部署、使用。它使得Qwen系列模型像种子,不断被散播并生根发芽,被全球开发者二次训练或部署使用。截至今年7月,阿里Qwen系列已开源300余个模型,全球下载量超4亿次,Qwen衍生模型数超14万个,是目前全球开源模型的领头羊(文章详见《阿里Qwen3系列模型发布,中美基础大模型竞争强度加大》)。

Qwen在开源社区,直接竞争对手是Meta的Llama系列模型。Meta 今年4月末在LlamaCon开发者大会披露,Llama全球下载量12亿次,衍生模型数万个。Qwen虽然下载量少于Llama,但衍生模型(开发者基于Qwen微调、创新的模型)数量超过Llama。

Llama作为美国模型,语言、文化天然适合契合全球最大的英语开发者群体,下载量容易更高。Qwen作为中国模型,能和Llama打成互有胜负,这侧面证明了其技术实力。

Qwen衍生模型数量更多的重要原因是,阿里采取了“全尺寸、全模态”的开源策略。Qwen开源的300多款模型覆盖文本、视觉、语音、代码、多模态等几乎所有模态。这为开发者提供了“应有尽有”的选择,开发者可以轻松找到合适的基座模型,在此基础上微调、创新,进而催生海量的衍生模型。

这种策略庞大的模型矩阵,覆盖了从入门级开发者到头部企业在内的用户,生态的活力容易因此激发。这也是为什么阿里云发起的AI开源社区魔搭会逐渐繁荣——它2022年11月初成立,目前有500家贡献机构,托管开源模型数量超7万个,增长超200倍。用户数量从2023年4月的100万扩展至如今的1600万,增长约16倍。

AI带动云增长飞轮

Qwen系列模型的技术、生态良性循环,也在加快它的商业化落地,进而带动阿里云的增长飞轮。

近半年,阿里云营收增速、市场份额均在反弹。2025财年(2024年4月1日-2025年3月30日),阿里云营收增速重回两位数增长——营收1180亿元,同比增长11.0%。

阿里集团CEO(首席执行官)、阿里云智能集团董事长兼CEO吴泳铭在2025财年后的投资者电话会中披露,阿里云的增长主要得益于AI相关需求,AI相关业务已连续七个季度实现100%以上增长。预计未来几个季度,阿里云收入仍将持续增长态势。

这和中国云市场大盘复苏的逻辑基本一致。国际市场调研机构IDC数据显示,2024下半年中国公共云(IaaS基础设施/PaaS平台软件/SaaS应用软件)市场增速17.7%,这是两年来的高点。这个过程中,AI投入越坚决,业绩增长越明显(文章详见《中国云市场复苏,出现五个关键趋势》)。

阿里的Qwen系列大模型,是如何让阿里云形成增长飞轮的?内在逻辑可分三层。

一是,大模型调用Token(大模型计量单位,一个token可以是单词、标点、数字、符号等)带来的直接收入。这部分收入暂时不高,在各家云厂商收入大盘中都占比很小。

二是,大模型开源生态带来的间接收入。这部分收入难以预估。但可以确定的是,Qwen开源为阿里云带来了大量高黏性客户,建立了难以被轻易复制的开发者生态护城河。

Qwen开源让开发者社区变活跃了。开发者免费使用Qwen系列开源模型,进行二次开发和应用创新。这些应用从开发走向部署时,容易选择与模型无缝集成、性能更优的阿里云。

三是,大模型带来的基础云产品销售。这才是真正的收入大头。大模型像“火车头”,拉动了阿里云全线产品的销售。

某中国科技巨头的一位战略规划人士年初对我们透露,2024年中国各个模型厂商的模型调用收入普遍只有千万元、数亿元。这部分收入寥寥无几,但模型调用带来了算力消耗、数据存储和传输等需求,这让公共云四大件(计算、存储、网络、数据库)收入增长反而更可观。阿里云收入增长大头,来自大模型带动的基础云产品销售。

今年6月,一位阿里云人士证实了上述说法。他提到,今年以来,“AI业务”带动“非AI业务”增长的逻辑也在微软Azure、谷歌云的身上同时出现了。在他看来,云厂商强行区分“AI业务”和“非AI业务”意义不大。因为所有AI业务最终都会跑在云上,进而带动底层云资源的消耗。

阿里云一直在中国云市场份额位居首位。Qwen系列模型巩固了它的领先优势——阿里云目前在中国的“AI云”市场也处于领跑地位。

IDC今年7月数据显示,2024年中国AI基础设施(AI IaaS)市场份额,阿里云占比23%,位居首位。阿里云在GenAI IaaS市场份额23.5%,同样位居首位。

IDC统计口径中的AI IaaS市场,包括大模型为核心的生成式AI IaaS(GenAI IaaS)和传统的非生成式AI IaaS。其中,2024年下半年中国GenAI IaaS市场同比激增165%,达87.4亿元,在整体AI IaaS市场中占比超过七成。

一位中国云厂商人士今年6月对我们表示,目前市场上谈到的“AI云”分成不同细分市场。Token调用是一个市场,GenAI IaaS(生成式AI基础设施)也是一个市场,但AI IaaS覆盖了前两者,它的统计覆盖面更广。目前市场存在一种误解是,仅用Token调用这个细分领域去概括整个“AI云”市场,但这并不能完全代表市场的完整全貌。

潜在逻辑很简单——目前中国市场开源模型的调用量,远大于闭源模型。鉴于当前各家Token价格定价偏低,Token调用量目前并不直接等于商业价值。我们从多家中国云厂商相关人士处了解到,2024年中国各个模型厂商的模型调用收入普遍只有千万元、数亿元,这部分收入寥寥无几。

但Token消耗量正在以10倍、100倍的速度快速增长,它未来有很大的增长空间。中国某头部云厂商的一位资深战略规划人士今年7月对未来市场容量做了一轮测算。测算结果显示,一些头部云厂商的Token调用收入未来几年可能增长到40亿-70亿元。阿里云等全力投入AI基础设施和大模型的厂商会是直接受益者。

一位阿里云高管今年7月对我们表示,阿里云目前的态度是,一方面积极拥抱和推动Token调用模式的增长;另一方面也通过“全栈AI”的能力,去满足客户不同层次、不同形态的的多样化需求,以此确保自己在市场变化时,仍然可以保持优势。

“重估阿里”的基础更坚实了

大模型正在成为直接影响阿里云业绩,甚至影响投资者重估阿里集团的重要“砝码”。

一位阿里云高管今年5月曾对我们表示,阿里集团管理层讨论后认为,阿里云需要成为能直接为股东创造回报,并正向影响集团股价的关键“砝码”。

在投资者眼中,阿里不仅是一家电商公司,更有可能成长为一家AI公司。2025年1月至今(7月26日),阿里集团股价增长超过40%。目前阿里集团纽交所股价是120美元。摩根士丹利在今年7月10日,把阿里目标价定为150美元——也就是说,阿里集团股价理论上还有25%的增长空间。

今年2月以来,“重估阿里”成为资本市场一种主流声音。但年初,“重估阿里”更多只是概念,它缺少坚实的业绩做支撑。

随着阿里的大模型、云计算业务不断取得进展,“重估阿里”的依据变得更充分了。3月以来,花旗、高盛、摩根士丹利发布了多份针对阿里集团业绩的研报。三大投行在“重估阿里”提到了一个共同观点——大模型是阿里价值重估的核心引擎,其潜力将通过阿里云的高速增长、高利润率来体现。

市场对“重估阿里”反复权衡的两个因素分别是:阿里集团的核心电商业务能否保持现有地位?阿里集团未来三年3800亿元资本开支的承诺能否得到预期回报?

今年5月以来,阿里、京东、美团开始了即时零售的竞争。花旗5月15日研报提到,经历激烈市场竞争后,阿里核心电商业务已稳住阵脚。阿里在即时零售(外卖)等新业务上的投入会影响短期利润,但这是抵御对手、长期增长必需的战略投资。

今年2月,阿里集团宣布未来三年将投入超过3800亿元,用于建设云和AI基础设施,总额超过去十年总和。仅在2025财年,阿里集团的资本支出就高达860亿元,同比增长168%。这一增速甚至超过了全球大部分头部科技公司(文章详见《科技巨头算力投资的五个关键事实》)。

阿里集团的3800亿元资本支出投入是何种水平?阿里能否承担起这样的巨额投入?它是否会侵蚀阿里的长期利润?这几个问题,将直接影响投资者未来如何“重估阿里”。

结论是,这笔支出是必要的,对阿里集团来说是可承受的,而且它有机会带来可观的投资回报率。

以2025财年860亿元为基础,阿里未来三个财年(2026财年-2028财年)资本支出年均复合增长率要达到21%。未来三个财年资本支出要达到1038亿元、1252亿元、1510亿元。

我们统计了阿里上市以来14个财年的资本支出情况,它的资本支出年均复合增长率(Compound Average Growth Rate,CAGR)是32.6%。如果阿里承诺完成3800亿元资本支出,其年均复合增长率仍然低于过去14个财年的平均水平。

对阿里来说,这一资本支出增速是正常且可负担的——阿里2025财年的经营性现金流1635亿元、期末现金余额1892亿元。这两个关键的现金流指标都高于当年资本开支数据。即使按照2028财年最高资本支出1433亿元计算,阿里过去五年的经营性现金流、期末现金余额也仍然高出这一数据。

阿里集团还可以通过低成本的方式获得融资,以此缓解现金压力。某ICT硬件企业的一位战略规划人士今年3月曾对我们解释,阿里集团这类科技巨头的融资手段,包括但不限于银行信贷、发行债券、高位套现售出股权等。科技巨头是银行的优质客户,融资成本极低,银行贷款利率甚至通常低于2%。

7月3日,阿里集团就曾公告称,计划发行本金总额约120亿港元,2032年到期的零息可交换债券。本次募集资金将用于投入云计算基础设施建设和支持国际电商业务发展。

关于3800亿元资本开支的投资回报率,高盛今年3月17日发布的研报中有详尽评估。高盛态度乐观,认为这得益于中国市场旺盛的AI训练推理需求和有利的定价环境。

高盛估算,阿里过去一个财年投入的AI基础设施,将能新增约300亿元年化AI收入。高盛还上调了对阿里云在未来两个财年的收入、利润增长预期。预计2026财年、2027财年的收入增速将分别达到24%和26%。2026财年、2027财年EBITA(阿里云通常把EBITA利润作为盈利指标,该口径剔除股权激励、无形资产摊销等非现金因素)利润率将分别达到11.9%和12.0%。

高盛对阿里集团整体CROCI(现金投资回报率,衡量企业现金流投资后收益的指标)评估结论是,2025财年该数据仅为14.5%,2026财年、2027财年将提升至16.5%和17.8%。

高盛提出,阿里集团3800亿元的最大不确定性因素是,美国对华AI芯片出口管制。这将直接影响阿里资本开支计划的执行能力和AI算力扩张速度。

这个不确定因素目前正在变得更有确定性。今年7月美国政府暂时放松了对中国的芯片出口管制,允许对中国市场出售英伟达H20等高端AI芯片。受此消息影响,阿里集团股价迎来一轮增长。

换句话说,云计算、大模型业务的积极进展,让“重估阿里”基础更坚实了。

特别声明:[行业观察|85天两次重大迭代,阿里大模型为什么死磕全球速度?(行业观察报告)] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

回归源头丨与甘露藏药共同见证,世界记录的诞(回归原主什么意思)

音乐人四郎贡布的“源头的声音”个人演唱会在此启幕,而雪域高原的藏医药传承者甘露藏药,以对生命源头的虔诚守护,成为这场世界最高海拔之上,勇创世界纪录盛典的同行者与见证者。 冈仁波齐的冰雪融水,是亚洲大河的源头;…

回归源头丨与甘露藏药共同见证,世界记录的诞(回归原主什么意思)

为什么新卡会容易被限制,而老卡不会呢?(为什么新办的卡)

通话异常封停 → 次月1日自动解封设备频繁更换 → 冻结72小时起步流量超额限速 → 缴费后立即恢复(地铁站里小伙对着新卡唉声叹气,旁边大爷的旧诺基亚却通话顺畅...)说真的,2025年最魔幻的不是5G网速…

为什么新卡会容易被限制,而老卡不会呢?(为什么新办的卡)

道格特科技申请磨针机控制相关专利 能够避免探针在研磨过程中变形(深圳道格特怎么样)

金融界2025年7月26日消息,国家知识产权局信息显示,深圳市道格特科技有限公司申请一项名为“磨针机的控制方法、电子设备、存储介质及磨针机”的专利,公开号CN120363034A,申请日期为2025年06月。…

道格特科技申请磨针机控制相关专利 能够避免探针在研磨过程中变形(深圳道格特怎么样)

正当防卫:梅筝是大boss,李沐风,江婷,段鸿山,都在她算计之内(正当防卫梅筝结局)

经过那起图书馆的惨案,李沐风的人生瞬间崩塌,而张源则让江婷和警方谎称梅筝是个没有道德的女人。更让人费解的是,警方当年在调查时居然没有深入追查,江婷说了几句谎话就被接受了?梅筝雇江婷杀掉张源,借着“正当防卫”…

正当防卫:梅筝是大boss,李沐风,江婷,段鸿山,都在她算计之内(正当防卫梅筝结局)

多个路由器牵线搭桥让Wi-Fi信号无死角(多个路由器牵线怎么设置)

1. 登录副路由器管理界面,点击 无线设置——> 无线基本设置 ,设置与主路由器相同的 SSID 号 及 信道 ,勾选 开启 WDS,点击 扫描 。 4.设置副路由器的无线密码:点击无线设置——>无线安全…

多个路由器牵线搭桥让Wi-Fi信号无死角(多个路由器牵线怎么设置)