刚刚,OpenAI神秘开源模型泄露!「闪现」1分钟被删,配置被网友扒光

刚刚,OpenAI神秘开源模型泄露!「闪现」1分钟被删,配置被网友扒光

刚刚,OpenAI开源模型疑似被手滑「泄露」?!

gpt-oss-20b 和 gpt-oss-120b!

网友@apples_jimmy在这组模型上传Hugging Face后一分钟内就发现了。

99%的概率这就是OpenAI的开源模型——

gpt属于OpenAI,oss代表开源软件,20b和120b代表了两个参数版本。

幸运的是,在它被删除之前,Jimmy Apples保存了配置,在只有不到「1分钟」的时间窗口!

他分享了一段LLM的配置文件,极有可能是OpenAI即将开源模型的详细参数。

这组参数像是一个基于MoE(Mixture of Experts)混合专家架构的高容量模型,具备以下几个特点:

· 36层Transformer,每层可能有MoE路由;

· 大规模MoE设置(128个专家,每个token激活4个);

· 词表超过20万,可能支持多语种或代码混合输入;

· 上下文窗口为4096,但也有滑动窗口和扩展RoPE,表明模型可能具备处理更长上下文的能力;

· 使用RoPE的NTK插值版本,这是许多模型扩展上下文的一种方式(如GPT-4 Turbo使用的方式);

· 注意力头多达64个,但键/值头只有8个,意味着模型用的是是Multi-QueryAttention(MQA)。

另一位网友@secemp9似乎验证了这次「泄露」的真实性。

他不仅也在Hugging Face上发现这个模型,甚至还有一位OpenAI成员点赞了他的爆料推文。

上传这个模型的组织叫做「yofo-happy-panda」,共有三名成员。

其中,Dominik Kundel正是OpenAI的现任员工,目前负责开发者体验和SDK。

有网友猜测,所谓的提前泄露,或许是GPT-5发布前的预热?

如果真是这样的参数配置,你满意吗?

特别声明:[刚刚,OpenAI神秘开源模型泄露!「闪现」1分钟被删,配置被网友扒光] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

火灾破坏力强,防火保险箱为贵重首饰提供防护(火灾破坏现场)

火灾发生时,高温与浓烟会对首饰造成毁灭性打击。同时,防火保险箱的密封性极佳,能有效阻挡浓烟进入,防止首饰被浓烟熏黑、腐蚀。无论是面对突如其来的火灾,还是潜在的盗窃风险,防火保险箱都能为贵重首饰提供全方位的防…

火灾破坏力强,防火保险箱为贵重首饰提供防护(火灾破坏现场)

使用电高压锅有危险吗?警惕五大危害缺点!(电高压锅有声音怎么回事)

许多消费者在网红博主的推荐下购买了宣称“7天无理由退换”的电高压锅,但使用后却发现其设计复杂,清洁起来相当麻烦,容易积累细菌,并且在加热过程中会有异味产生。 许多电高压锅品牌在宣传中往往夸大其功能,如宣称能…

使用电高压锅有危险吗?警惕五大危害缺点!(电高压锅有声音怎么回事)

她曾是古装第一美人,被狗咬毁容后,现在40岁靠演坏女人翻身(她曾经是皇女,如今是我老婆下载)

原本李依晓以为这辈子京剧舞台会是她最好的归宿,然而没想到青春貌美的她会被导演邀请参与电视剧拍摄,从而踏上了演绎之路。 其实,李依晓最令人点赞的地方不是美,而是出道18年从未演过主角🎭️的她,却凭演技让观众和粉丝…

她曾是古装第一美人,被狗咬毁容后,现在40岁靠演坏女人翻身(她曾经是皇女,如今是我老婆下载)

甜掉牙!7部“青梅竹马”爱情小甜剧,每部都值得N刷!

李尖尖和凌霄从"哥妹"变"CP"的极限拉扯,贺子秋哭戏直接让我用光三包纸巾。没有狗血只有真实的青春,连熬夜复习和暗恋小心思都拍得这么戳人,编剧怕不是在我家装了摄像头?建

甜掉牙!7部“青梅竹马”爱情小甜剧,每部都值得N刷!

著名演员去世,享年89岁!曾出演《美国队长2》《复仇者联盟4》等(演员 逝世)

据外媒,美国著名演员、导演、编剧罗伯特·雷德福去世,享年89岁。 雷德福1950年代开始演艺生涯,出演了《虎豹小霸王》《走出非洲》《骗中骗》《大河恋》《一切尽失》《重返荣耀》《老人与枪》《美国队长2》《复仇者…

著名演员去世,享年89岁!曾出演《<strong>美国队长2</strong>》《<strong>复仇者联盟4</strong>》等(演员 逝世)