为了不被挤下牌桌,OpenAI又开源了

为了不被挤下牌桌,OpenAI又开源了

今日霍州(www.jrhz.info)©️

今日霍州(www.jrhz.info)©️

今日霍州(www.jrhz.info)©️

当下开源相对闭源更容易出现“赢家通吃”的情况,但所有人都在“卷”开源模型的状态可能不会持续太久

文|《财经》研究员 周源 吴俊宇 黄思韵

编辑|谢丽容

最早引领全球人工智能大模型风潮的『明星』️创业公司OpenAI近期有了大的产品逻辑和战略转变。

8月5日,OpenAI宣布开源两款权重模型——参数量为1170亿的gpt-oss-120b和参数量210亿的gpt-oss-20b,分别针对云端高推理与边缘低延迟两大场景。这是自2019年开源GPT-2以来,OpenAI再次在开源领域发力。

OpenAI在2015年成立,2022年11月30日,该公司发布的ChatGPT凭借“能流畅对话、写代码、创作内容”迅速红遍全球,5天内用户破百万,2个月破亿,是全球『互联网』历史上最快达到这一规模的产品(此前TikTok用了9个月)。

时至今日,OpenAI在全球消费级市场的优势其实仍然难以撼动。根据今年八月最新数据,ChatGPT 周活跃用户已达7亿,同比增长4倍,日均消息量突破30亿条。其付费用户数从2024年的300万增至500万,Pro会员和企业版用户贡献了超60%的收入。这一增长速度远超同期谷歌Gemini App(月活 4.5 亿)和 Anthropic Claude(『安卓』版首周下载仅1万+)。

但在更加广阔的企业级市场,OpenAI份额正在面临可能进一步被Anthropic(预计今年四季度达35%)和谷歌(20%)蚕食的现实挑战。另外,还有更多来自其他走开源路线的潜在竞争对手在悄然蚕食OpenAI的竞争优势。

开源还是闭源,至少在当下,可能会决定这家公司未来增长潜力和方向。

其实,OpenAI成立之初,秉承的是开源理念。2018年发布GPT-1模型,以及2019年发布的GPT-2模型,在一定程度上都体现了其开源的理念。

真正标志着OpenAI走向闭源路线的时间节点是2025年。2025年5月,OpenAI将GPT-3以论文形式发布,至此,OpenAI不再公开模型的权重、代码或训练数据,开发者无法只能通过OpenAI提供的API接口按规则调用OpenAI的模型。

闭源的商业模式为OpenAI带来不少批评之声,认为这偏离了该公司所宣称的“造福全人类”的初衷,甚至有人调侃OpenAI应改名“CloseAI”。该公司首席执行官山姆・奥特曼(Sam Altman)对此公开解释称,OpenAI的核心使命是确保人工智能的安全,在决定是否开源时,需要谨慎权衡开源可能带来的安全风险。

2025年初,中国AI创业公司『DeepSeek』(深度求索)推出开源模型『DeepSeek』 R1,引发全球AI产业的高度关注。前谷歌CEO Eric Schmidt在媒体采访时警告⚠️:“如果我们不对此采取行动,中国最终将成为开源领域的领导者,而世界的其他地方将走向闭源。”

今年2月,在美国『社交平台』Reddit的一次公开活动上,有用户问『DeepSeek』的崛起是否会改变OpenAI对未来模型开源的计划。奥特曼不仅承认『DeepSeek』的模型“非常好”,并表示他个人认为OpenAI在开源问题上“站在了历史的错误一边”,需要制定一个不同的开源策略。

今日霍州(www.jrhz.info)©️

多大程度的开源?

奥特曼称OpenAI新推出的开源模型为“全球最强开放模型”。

据介绍,两款gpt-oss模型均采用Transformer架构,并利用专家混合(MoE)来减少处理输入所需的活跃参数数量。

其中,gpt-oss-120b 专为生产环境、通用应用和高推理需求而设计,其每个token激活5.1亿参数,虽然总参数量高达1170亿,但却能够在单个『英伟达』专业『数据中心』GPU上运行,该模型既能部署在『数据中心』,也能在高端台式机和笔记本📓电脑💻️上运行。

gpt-oss-20b则更侧重于本地化和专业化使用场景,激活36亿参数,仅需16GB内存就能运行,大多数现代台式机和笔记本📓电脑💻️都能够轻松驾驭。

今日霍州(www.jrhz.info)©️

OpenAI两款开源模型一经发布立即引发高度关注,在全球知名AI开源社区“抱抱脸”(Hugging Face)上,两款模型的下载量激增,以至于Hugging Face首席技术官公开请求大家不要急着第一时间下载,否则其『服务器』会“崩溃”。

Agent公司图灵集市首席技术官陈俊哲告诉我们,尽管OpenAI这次开源模型的性能很吸引他,但对于许多应用场景而言,20B规模的模型成本过高,其显存开销是主流参数模型7B-8B模型的3倍。

陈俊哲所在公司使用的是阿里Qwen系列8B开源模型。他表示,对于中小创业公司而言,小尺寸开源模型更具有吸引力,尽管中国市场也存在30B甚至70B等更大规模的开源模型,但7B-8B模型因其低成本和高灵活性而备受青睐。

两款开源模型均遵循宽松的Apache 2.0开源许可协议,为商业和研究使用提供了极大的自由度。

这也是OpenAI继GPT-2模型之后首次推出开放权重(open-weight)的语言模型。所谓开放权重,是指开发者在使用开源的权重模型时,不必通过OpenAI官方提供的应用程序接口(API)来调用模型功能。

API 接口就像是一个“中间商”,过去开发者若想使用OpenAI的模型,得通过这个接口连接到OpenAI的『服务器』,按调用次数付费,且所有数据处理和计算都在OpenAI的系统中完成,开发者受限于OpenAI的调用规则、费用标准和数据隐私政策。

而当模型权重开源后,开发者可以把完整的模型文件下载到自己的『服务器』、电脑等硬件设备上。此时,运行模型、处理数据、生成结果等一系列操作都在本地完成,无需再与OpenAI的『服务器』产生连接,自然也就不用依赖其API 接口了。

这一变化的意义较大,它让开发者在使用模型时更自由,能自主控制数据处理流程,降低对外部平台的依赖,还能节省API调用的费用,尤其适合有大量处理需求或对数据隐私有高要求的场景。

但OpenAI官方明确表态,不会开源训练数据与完整训练代码。

从技术层面来看,训练数据如同模型的“学习素材”,完整训练代码则是模型构建的“操作指南”。不开源训练数据,使得外界难以知晓gpt-oss模型究竟“学了什么”,模型在训练过程中所使用的数据来源、数据处理方式等关键信息被隐藏。

训练代码的缺失,意味着开发者无法复刻模型的训练过程,不能根据自身需求重新训练模型。例如无法对训练代码进行修改,来适配不同的硬件环境,或是尝试新的训练算法以提升模型性能。

多位行业人士向我们表示,这一做法是OpenAI维护自身优势的重要手段。因为训练数据和完整训练代码是其核心资产,倘若开源,竞争对手可能利用这些资源,快速提升自家模型性能,削弱OpenAI 在市场中的领先地位。

但硬币🪙的另一面是,这种做法意味着开发人员无法获取训练数据和代码,限制了对模型的深入研究,缺少这些关键要素,降低了模型的可验证性与可重现性,无法充分发挥开源的优势。

今日霍州(www.jrhz.info)©️

为了成为更大的赢家?

市场普遍认为,OpenAI此次开源的主要目的是为了扩大自家模型在全球市场的影响力。

近一年,开源模型的市场影响力不断扩张。因为开源模型任何人都能下载、部署、使用。开源模型就像种子,不断被散播并生根发芽,被全球开发者二次训练或部署使用。

对于OpenAI来说,开源模型的推广渠道和此前大不一样。8月6日,OpenAI这两款开源模型很快登陆了亚马逊AWS。这意味着OpenAI获得了全球最大云厂商的“带货能力”,企业客户可以直接在亚马逊AWS上使用这两款模型。且企业自己也可以把OpenAI这两款模型部署到谷歌云、阿里云等其他云平台上,而不是像过去只能在微软Azure上使用OpenAI的模型。

2024年之前,大模型领域一个曾经的共识是,开源模型和闭源模型的性能存在差距。不过,近一年,开源模型正在不断缩小和闭源模型之间的差距。尤其是中国AI创业公司『DeepSeek』旗下的『DeepSeek』-R1、阿里旗下的Qwen 3系列都打破了这一刻板印象。

比如『DeepSeek』-R1和阿里Qwen 3借助开源策略,下载量、调用量、衍生模型数量都在全球领先。截至今年7月,阿里Qwen系列已开源300余个模型,全球下载量超4亿次,Qwen衍生模型数超14万个,是目前全球开源模型的领头羊。

今年6月,阿里云CTO、通义实验室负责人周靖人在魔搭开发者大会群访环节曾对我们表示,一个成功的开源模型生态,其价值绝不止于模型本身,而在于围绕模型构建起的价值网络——包括丰富的应用案例、活跃的社区交流氛围。通过开源,模型厂商可以获得来自全球数千万开发者的宝贵反馈,包括使用体验、Bug报告和功能建议,这种良性的互动对于模型的快速迭代和优化至关重要。

OpenAI重回开源这一举措也意味着,未来AI巨头将更多采取开源闭源两手抓模式,即开源部分基础模型,同时保留更先进、更具商业价值的模型作为核心竞争力。

不过,也只有头部企业或者极少数能持续融资的创业公司能坚持开源。因为开源模型无法直接获得收入。例如,OpenAI在亚马逊AWS上的开源模型,企业客户并不需要为OpenAI支付模型使用和API调用费用,只需要为亚马逊AWS支付算力费用。无法直接获得收入,这是很多企业犹豫是否要开源的重要原因。

从营收来看,OpenAI有长期打“开源牌”的商业基础。

此前有媒体报道,截至今年7月末,OpenAI预计将实现120亿美元💵的年度经常性收入(ARR,Annual Recurring Revenue)。这一营收规模使得OpenAI成为全球最大的AI创业公司,且远超它的最大竞争对手Anthropic。截至今年7月末,Anthropic的年度经常性收入预计仅为50亿美元💵。

今日霍州(www.jrhz.info)©️

OpenAI重新开源开放势必影响到全球开源模型竞争格局。

当下AI产业的一大现象是,越来越多中国科技公司参与到全球开源模型竞速中。7月31日,全球知名AI开源社区“抱抱脸”(Hugging Face)趋势热门榜单前10名中,中国大模型占据8席。活跃其中的角色,分别是头部『互联网』公司阿里、腾讯,和“AI六小虎”中的智谱、月之暗面(更多信息参见)

至少在当下,相比闭源,开源更容易出现“赢家通吃”的情况。

但一位头部科技公司技术负责人告诉我们,大家都在“卷”开源模型的状态不会持续太久,“大模型还处于比较早期的阶段,且大公司还没有拿到绝对优势,大家都有机会成为赢家”。

今日霍州(www.jrhz.info)©️

今日霍州(www.jrhz.info)©️

今日霍州(www.jrhz.info)©️

责编 | 杨明慧

封图来源 | 视觉中国

今日霍州(www.jrhz.info)©️

特别声明:[为了不被挤下牌桌,OpenAI又开源了] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

马斯克21岁女儿:改名字、换性别、与父亲决裂后,靠当模特力争经济独立(马斯克 女)

2022年4月18日——即18岁生日过后没几天,已经成年的薇薇安·詹娜·威尔逊向洛杉矶法院申请更改姓名和性别,理由包括“性别认同,以及我不再与我的亲生父亲一起生活,也不想以任何方式、形式或形态与我的亲生父…

马斯克21岁女儿:改名字、换性别、与父亲决裂后,靠当模特力争经济独立(马斯克 女)

为她放弃二十年婚姻,现年六十一岁偶遇,巫刚当初的坚守是否值得(为她放弃二十年小说)

她曾经以为自己是彻底的不婚派,却在2002年拍摄生死十七天时遇到了巫刚,从此两人的生命中多了一份陪伴。巫刚曾经历情感创伤,但陈瑾的出现,填补了他生命中的缺失,即使知道对方不打算结婚,他也无所谓,只要能陪伴,就…

为她放弃二十年婚姻,现年六十一岁偶遇,巫刚当初的坚守是否值得(为她放弃二十年小说)

第一个表态!安妮长公主明确态度:拒绝哈里回归,给查尔斯忠告(第一个发言)

吃瓜群众纷纷猜测:难不成这对别扭了这么多年的父子真要上演大和解戏码?但安妮长公主这波强硬表态,分明是把这扇门给焊死了一半! 最绝的是哈里受访时那句"我可以原谅所有人",听着像是要大度和解,可仔细品品...

第一个表态!安妮长公主明确态度:拒绝哈里回归,给查尔斯忠告(第一个发言)

妻子比嫦娥还美,现在儿子也事业有成,“猪八戒”原来长这样!(嫦娥丈夫不是后羿)

在马德华成名之前,他的父母就为他的终身大事而着急。在亲朋好友的牵线搭桥下,马德华结识了侯玉敏。马德华在事业上孜孜以求,在家庭中也是一位称职的丈夫和父亲。他用自己的努力和坚持,从一个武术少年蜕变为家喻户晓的表…

妻子比嫦娥还美,现在儿子也事业有成,“猪八戒”原来长这样!(嫦娥丈夫不是后羿)

『全红婵』伤愈首秀,夺冠! 再现“水花消失术”(『全红婵』训练受伤)

11月2日,在第十五届全运会跳水项目女子团体比赛中,广东队的『全红婵』和王伟莹凭借绝对优势夺得女子团体双人10米跳台冠军。这是『全红婵』时隔5个月再次参加正式比赛。当晚,『全红婵』在『社交媒体』上发文:“我真棒”

『全红婵』伤愈首秀,夺冠! 再现“水花消失术”(『全红婵』训练受伤)