突发!OpenAI 放大招,时隔六年再开源,国内大厂刚疯狂 “内卷” 完……

突发!OpenAI 放大招,时隔六年再开源,国内大厂刚疯狂 “内卷” 完……

作者 | 雷晶 校对 | Tina 策划 | Eason

来源| 第一新声

图片|公众号AI生成

8月6日凌晨,OpenAI发布了两款开源大语言模型gpt-oss-120b和gpt-oss-20b。这是自2019年开源GPT-2以来,OpenAI首次发布开源模型。

OpenAI时隔六年再推开源大语言模型,释放技术普惠信号。这一举动无疑在全球人工智能领域投下一枚重磅炸弹,也让国内大模型竞争格局面临新的变数。

华丽回归“技术的伟大胜利”

据官方介绍,这两款模型均为纯文本语言模型,在文本处理、代码生成、数学问题求解等领域表现强劲。gpt-oss-120b总参数量为1170亿,激活参数为51亿,能够在单个80GB的GPU上运行,专为生产环境、通用应用和高推理需求的用例设计,既可以部署在数据中心,也能在高端台式机和笔记本电脑上运行。

而gpt-oss-20b总参数量为210亿,激活参数为36亿,专门针对更低延迟、本地化或专业化使用场景优化,在16GB的GPU上就能运行,这意味着大多数现代台式机和笔记本电脑都能驾驭。

在模型架构上,二者均采用了Transformer架构,并融入专家混合(MoE)设计,以此减少处理输入时激活参数量,提升推理与内存效率。它们还借鉴了GPT-3的设计理念,采用交替的密集注意力和局部带状稀疏注意力模式,使用分组多查询注意力机制以及旋转位置编码,原生支持128k上下文。

训练数据上,则重点聚焦于STEM、编程和通用知识领域,并使用o200k_harmony分词器进行数据分词,该分词器是OpenAI o4-mini和GPT-4o所用分词器的“超集”,也于此次同步开源。

除了性能强劲,OpenAI为这两款模型赋予了诸多实用特性。

其采用宽松的Apache 2.0许可证,开发者可自由用于构建,无copyleft限制或专利风险。任何消费者、开发者或企业可免费下载模型,进行参数级微调以适配特定用例,并用于商业服务或创收,无需向OpenAI支付费用,便于实验、定制和商业化部署。

模型具备可配置的推理强度,能依据用户具体用例和延迟需求,轻松调整推理投入程度。同时支持完整的思维链,可完整访问模型的推理过程,便于开发者调试并提升输出结果的可信度,还支持参数级微调,开发者能够根据特定用例对模型进行深度定制。

另外,模型具备智能体能力,可利用原生的函数调用、网页浏览、Python代码执行和结构化输出等功能,进一步拓展应用场景。

本次开源的gpt-oss支持本地运行,无需连接网络,数据也不必上传到云端,这一特性能够满足金融、医疗等受严格监管行业对数据隐私的要求。

但值得一提的是,这次开源并不彻底,这两款模型属于开放权重(open-weight)大语言模型,不提供训练数据和完整训练代码。

OpenAI的开源或许是对市场竞争压力的回应。当前,全球AI市场竞争激烈,新兴力量崛起迅速,在这样的环境下开源成为重要手段,可以吸引更多开发者,完善其生态系统。

受到冲击 国内大模型格局或有变局

在OpenAI开源之前,国内的大模型开源早已进行得如火如荼。

近几个月来,腾讯、智谱AI、昆仑万维、阿里巴巴、月之暗面等头部企业密集发布新一代开源大模型,将AI开源战场推至前所未有的热度。

百度文心早在6月开源ERNIE-4.5系列,覆盖0.3B至47B参数规模,以中文多模态能力见长,在C-Eval等基准测试中超越GPT-416。

腾讯混元则在8月4日宣布开源四款轻量级模型0.5B、1.8B、4B、7B,覆盖从端侧到云端场景,消费级显卡即可运行,并适配手机、平板、智能座舱等低功耗设备。其核心创新包括256K长上下文窗口,可处理40万汉字、双脑协作架构,即“快脑”即时响应、“慢脑”深度推理,以及强化Agent能力。

阿里巴巴的通义千问(Qwen)系列也在持续迭代。7月刚推出Qwen3推理模型,可原生支持256K上下文处理能力,可应对更长文本、构建更深的推理链,自动启用多步推理,无需用户手动切换模式。8月通义千问系列又推出了图像生成基础模型Qwen-Image,主打复杂文本渲染能力,能在不同场景中,准确地生成不同语种、风格的文字,甚至可以写毛笔字书法,或是直接生成带有文本和图像的PPT页面。

智谱AI在8月3日开源GLM-4.5(355B MoE)及轻量版GLM-4.5-Air(106B),主打智能体原生架构与低成本推理(API成本低至0.8元/百万tokens),48小时内登顶Hugging Face趋势榜。

除传统巨头外,垂直领域企业表现也相当活跃。

昆仑万维开源多模态模型Skywork-R1V3-38B与轻量图文生成模型Skywork-UniPic-1.5B,入选“中国AI开源16强”。字节跳动发布多语言翻译模型Seed-X-Instruct-7B与通用多模态模型Tar-7B。月之暗面推出数学证明专精模型Kimina-Prover-72B,其基础模型Kimi-K2跻身Chatbot Arena全球前五。蚂蚁集团则聚焦金融场景,开源数据集Agentar-DeepFinance及轻量多模态模型Ming-Lite-Omni-1.5B。

据Hugging Face中国社区统计,7月单月16家机构共开源31个模型及工具,覆盖文本、图像、3D生成等全模态场景。

如今,OpenAI携gpt-oss-120b和gpt-oss-20b两款开源模型强势入局,无疑为国内大模型开源竞争格局带来巨变。

从积极方面看,其开源行为为国内企业提供了学习借鉴先进技术的契机,通过研究OpenAI模型架构、训练方式等,国内企业可以优化自身模型,实现技术升级。

然而,挑战也随之而来。OpenAI凭借其知名度与技术领先形象会吸引部分国内开发者与用户资源。国内企业如何充分发挥本地化优势成为亟待解决的课题。

这场全球性的大模型开源竞赛才刚刚开始。

特别声明:[突发!OpenAI 放大招,时隔六年再开源,国内大厂刚疯狂 “内卷” 完……] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

肖战内娱唯一真财神,荣耀市场份额创新高,藏海传香港播出满广(感觉肖战内娱最火)

肖战的每一块光点转化为1.6亿的价值,实体专辑在预售阶段4分钟内便破5000万,这样的表现真是让人对肖战的“财神爷”称号深信不疑。他的价值体现在商业和影视两大领域,而肖战在这两个方面的表现均属顶尖——这个多边…

肖战内娱唯一真财神,荣耀市场份额创新高,藏海传香港播出满广(感觉肖战内娱最火)

工业4G5G破局实录:三年解锁河南50+工厂设备联网困局(工业5g是什么意思)

工业4G5G,正成为解锁设备层数据价值的关键路径。 无线灵活性:设备物理位置变动仅需网关随迁,4G5G广覆盖保障业务连续性。工业5G网关方案: 20台新设备3小时内联网上线,保障进度。工业4G5G,不…

工业4G5G破局实录:三年解锁河南50+工厂设备联网困局(工业5g是什么意思)

59岁温碧霞香港过生,16岁养子想亲吻妈妈,爸爸却拉开,面露尴尬(温碧霞在香港女星中算)

有一个小细节引发了网友的热议:在儿子想亲吻妈妈的时候,老爸突然伸手将儿子拉开,这一幕让两人都显得有些尴尬。一些网友觉得,儿子已经16岁了,可能在这么多人的面前亲吻妈妈会感到不好意思。 提到温碧霞和她的丈夫何祖…

59岁温碧霞香港过生,16岁养子想亲吻妈妈,爸爸却拉开,面露尴尬(温碧霞在香港女星中算)

X2CrNiMoN17-11-2不锈钢提高了材料的屈服强度和抗晶间腐蚀性能

X2CrNiMoN17-11-2双相不锈钢兼具高强度与韧性,通过氮元素强化抗腐蚀性,在化工、海洋工程及医疗领域表现卓越,是苛刻环境下的可靠选择。氮元素的加入显著提高了材料的屈服强度和抗晶间腐蚀性能,同时保持了…

X2CrNiMoN17-11-2不锈钢提高了材料的屈服强度和抗晶间腐蚀性能

成为传奇缪骞人是周润发的初恋,刘德华想娶她,和导演王颖裸婚(成为传奇缪骞结局)

在电影中,周郁芬因为误接电话而怀疑丈夫有外遇,并以此为创作题材写出了一部小说,结果这部小说大受欢迎为了报复丈夫,她与旧情人同居这个复杂的角色让缪骞人有机会展现她的演技深度,她也因此获得了第23届金马奖最佳女…

成为传奇缪骞人是周润发的初恋,刘德华想娶她,和导演王颖裸婚(成为传奇缪骞结局)