刚刚,OpenAI神秘开源模型泄露!「闪现」1分钟被删,配置被网友扒光

刚刚,OpenAI神秘开源模型泄露!「闪现」1分钟被删,配置被网友扒光

刚刚,OpenAI开源模型疑似被手滑「泄露」?!

gpt-oss-20b 和 gpt-oss-120b!

网友@apples_jimmy在这组模型上传Hugging Face后一分钟内就发现了。

99%的概率这就是OpenAI的开源模型——

gpt属于OpenAI,oss代表开源软件,20b和120b代表了两个参数版本。

幸运的是,在它被删除之前,Jimmy Apples保存了配置,在只有不到「1分钟」的时间窗口!

他分享了一段LLM的配置文件,极有可能是OpenAI即将开源模型的详细参数。

这组参数像是一个基于MoE(Mixture of Experts)混合专家架构的高容量模型,具备以下几个特点:

· 36层Transformer,每层可能有MoE路由;

· 大规模MoE设置(128个专家,每个token激活4个);

· 词表超过20万,可能支持多语种或代码混合输入;

· 上下文窗口为4096,但也有滑动窗口和扩展RoPE,表明模型可能具备处理更长上下文的能力;

· 使用RoPE的NTK插值版本,这是许多模型扩展上下文的一种方式(如GPT-4 Turbo使用的方式);

· 注意力头多达64个,但键/值头只有8个,意味着模型用的是是Multi-QueryAttention(MQA)。

另一位网友@secemp9似乎验证了这次「泄露」的真实性。

他不仅也在Hugging Face上发现这个模型,甚至还有一位OpenAI成员点赞了他的爆料推文。

上传这个模型的组织叫做「yofo-happy-panda」,共有三名成员。

其中,Dominik Kundel正是OpenAI的现任员工,目前负责开发者体验和SDK。

有网友猜测,所谓的提前泄露,或许是GPT-5发布前的预热?

如果真是这样的参数配置,你满意吗?

特别声明:[刚刚,OpenAI神秘开源模型泄露!「闪现」1分钟被删,配置被网友扒光] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

上海行人不走人行道或被开罚单 新规促安全出行(上海行人不走斑马线被登记)

最近,有网友发帖称,在上海街道上因没有走在人行道上被开具罚单。罚单显示,该行为违反了《中华人民共和国道路交通安全法》第六十一条的规定,决定处以警告。这名网友感到十分新奇,并表示原本以为很平常的事情原来也在法律范围内,希望大家引以为戒

上海行人不走人行道或被开罚单 新规促安全出行(上海行人不走斑马线被登记)

建筑物节能监测系统:提升能效的未来趋势(建筑物节能监测方案)

建筑物节能监测系统通过集成多种传感器和监控设备,对建筑内部各类能耗进行实时监测。实施建筑物节能监测系统后,建筑管理者可以获得显著的实际效益,这不仅体现在经济上,还包括环境保护和社会效益等方面。 建筑物节能…

建筑物节能监测系统:提升能效的未来趋势(建筑物节能监测方案)

暑假考驾照?用上鸿蒙5这几个APP,科目一速通真不难(暑假考驾照会便宜多少)

刷题工具驾考宝典和驾校一点通这两款应用在鸿蒙5上有了新玩法。 而且这两款应用的题库都更新到了7月最新版,平时等公交、坐地铁的碎片时间好好利用起来,最新考试题目一手掌握,拿下科一科四稳稳的。鸿蒙版交管12123…

暑假考驾照?用上鸿蒙5这几个APP,科目一速通真不难(暑假考驾照会便宜多少)

奕威汽车取得电磁阀密封结构专利,有效保证电磁阀正常工作(奕威汽车取得电子发票)

专利摘要显示,本实用新型涉及电磁阀技术领域,尤其涉及一种电磁阀密封结构,包括:与阀体相连接的活塞座、相对活塞座沿轴向滑动设置的动铁芯组以及用于驱动动铁芯组滑动的电磁线圈;活塞座包括与阀体连接的连接头、及供动…

奕威汽车取得电磁阀密封结构专利,有效保证电磁阀正常工作(奕威汽车取得电子发票)

格力热泵||连续9年荣获“热泵行业领军品牌”!(格力热力泵空调有制冷的效果吗?)

为推动我国热泵产业高质量发展,由中国节能协会热泵专业委员会主办,主题为的“2025年中国热泵行业年会暨第十四届国际热泵行业发展高峰论坛”于2025年7月30日在济南喜来登大酒店隆重召开。目前,格力通过在商业…

格力热泵||连续9年荣获“热泵行业领军品牌”!(格力热力泵空调有制冷的效果吗?)