全网疯传GPT-5泄露！首次统一GPT和o系列，编程实测demo抢先曝光，下周发布？(gpt-815)

科技夏伤2025年08月11日 15:0123阅读

全网疯传GPT-5泄露！首次统一GPT和o系列，编程实测demo抢先曝光，下周发布？(gpt-815)

明敏鹭羽发自凹非寺

量子位 | 公众号 QbitAI

GPT-5这回是真的要来了。

现在，全网都在“偶遇”GPT-5。

不仅是ChatGPT上有踪迹：

而且在 MacOS应用的模型列表中也发现了GPT-5。

还有Cursor、微软Copilot以及OpenAI API平台上，也都被网友捉到已经悄悄接入/测试GPT-5。

这一大波泄露，大家对GPT-5的热情和好奇再次被重新拉回高点，还是奥特曼会玩啊。

连向来怼天怼地的马库斯都说：不开玩笑，这一次GPT-5真的要来了。

从已经泄露的信息来看，GPT-5肯定更强大。

它将整合GPT系列和o系列，实现多模态和推理能力大一统、编程能力很强、百万tokens上下文、支持MCP等。

最快下周就会发布！

感觉GPT-5这一波，是要全面铺开啊。

所以到底有多强？

两款模型都编程能力突出

根据OpenAI内部人士透露，GPT-5实现推理能力（o系列）和多模态交互能力（4o以及GPT系列）的大一统，以后不用再手动切换模型。

模型包含多个版本：

GPT‑5 主模型（代号 “nectarine” 或 “o3‑alpha”）
GPT‑5 mini（代号 “lobster”）
GPT‑5 nano（代号 “starfish”）

模型的技术亮点可能包括：

输入上下文窗口高达100万tokens，输出可达10万tokens。
支持MCP（模型上下文协议）与并行工具调用。
动态处理短时与长时推理，集成 Code Interpreter 与其他工具。
性能更快、更可靠、更少幻觉、提升长期对话记忆与逻辑处理能力。

其中 GPT-5（o3-alpha）被曝在高级编程方面表现出色，能达到接近人类程序员水平，“实现更快、更精准的软件开发”。

它可以自动编写高质量的游戏原型，支持很多应用程序定制以及可以根据特定要求进一步细化。

以及在物理方面也表现出色，一些zero-shot的demo效果也很不错。

Lobster（mini版本代号）有消息称它是一个专用的编程模型。在精度和功能方面均优于Claude 4等模型，尤其是在一些复杂的编码任务上。

Lobster可以通过极少的输入快速生成结构完整、功能准确的代码，非常适合处理凌乱的遗留代码，可以自动优化代码结构、清除冗余，同时管理大型软件项目中的依赖关系。

例如一名用户让Lobster和另一个模型同时创建交互式神经网络动画，Lobster一次性就生成了一个带有彩色节点的解决方案，而另一个模型在代码运行中出现错误。

另外Lobster据悉也集成了o3系列模型的高级推理能力，能在简单任务中使用快速响应模式，在复杂任务中触发深层推理模块，更擅长逻辑推理以及解决数学问题。

支持文本、图像、工具调用等多模态，具备类似Agent的多步骤组合执行能力，可以让其同时完成解释图像、编写代码和使用工具等任务，而无需像GPT-4一次只能处理一类输出。

Lobster将是编码、推理、多模态理解的融合，将OpenAI之前彼此独立的模型集合在一起，让用户直接拥有一个功能更强大的工作助手，轻松执行复杂的多步骤任务。

starfish（nano版本）则在前几天悄悄出现在了大模型竞技场上。

测试结果显示，这个模型只能做静态的小游戏界面，无法启动游戏。

除了模型本身外，现在微软和cursor也被曝将火速接入GPT-5。

微软正试行新版Copilot的 “Smart 模式”（或称 “magic mode”），能够智能判断何时调用GPT‑5的深度推理与多模态能力，以简化用户无需手动选择模型的流程。这项功能显示微软极可能在GPT‑5发布后第一时间集成该模型至Copilot及Microsoft 365生态中，Azure也在为集成GPT-5做准备。

同时也有人发现，cursor团队正在内部测试GPT-5 Alpha版本（图中被模糊掉的部分原来标了GPT-5-Alpha）。

但大家不容易被奥特曼忽悠了

从各方泄露信息来看，GPT-5确实如奥特曼所说，强得可怕。

不过，现在大家更冷静、更理智、也更不容易被忽悠了。

有人就说，那又如何？GPT-5可能在刚刚发布时表现很好，1周过去它就会开始变笨，像此前所有模型一样。

也有人表示这可能是因为模型发布后，出于安全考量会ban一部分能力，所以让大家感觉这是炒作出来的幻象。

“泼冷水王”马库斯也发文表示，即便GPT-5真的更强大，但是他还是要给出7个悲观预测：

尽管GPT-5在能力上会远超GPT-4，但GPT-5仍然是难以控制的，会继续犯一些难以预料的低级错误，甚至不会完全听从指令操作。
GPT-5仍然难以处理一些复杂的物理、心理和数学推理任务。
幻觉依旧普遍，且误导性更高，更容易生成看起来正确但实际内容错误的输出。
自然语言输出仍然无法可靠地链接到下游系统（如数据库、虚拟助手等），自然语言指令难以准确映射到用户意图上。
GPT-5不会是像AGI一样的通用人工智能，仍旧需要其它工具协助完成复杂场景任务。
系统仍将无法稳定地遵循有用无害的人类价值观，在输出回答时可能隐含部分偏见。
GPT-5只是基础的规模扩展，未来AGI将朝向更结构化、具备显性知识与规划能力发展，与更广泛的其它技术集成，而这些都是GPT系列所缺乏的。

社区里也弥漫着相似的观点，毕竟已经被奥特曼溜了太多次，再不发布，网友们都累了……

天天各种真假混杂的爆料，一些泄露的GPT-5基准测试都是fake news，网友表示，现在除了官方，谁都不可信。

当然也有不少网友认为，这些“不经意间的”泄漏，都是OpenAI在炒作。

总之，不管模型是不是真如宣传所说的这么好，都赶紧发布吧！

参考链接：

[1]https://www.geeky-gadgets.com/openai-gpt-5-lobster-ai/

[2]https://garymarcus.substack.com/p/what-to-expect-when-youre-expecting-62e

能力推理 Lobster 系列实测

特别声明：[全网疯传GPT-5泄露！首次统一GPT和o系列，编程实测demo抢先曝光，下周发布？(gpt-815)] 该文观点仅代表作者本人，今日霍州系信息发布平台，霍州网仅提供信息存储空间服务。

猜你喜欢

2025-08-10

披荆斩棘4二公揭秘：王铮亮尤长靖赢麻了，熊梓淇王一哲出局(披荆斩棘4二公舞台排名)

近日，披荆斩棘4第二次公演已圆满录制完成，这一轮的比拼不仅让观众们感受到了哥哥们和弟弟们的激情与汗水，更是见证了几位选手的荣耀与失落。其中，王铮亮和尤长靖凭借出色的表现成为大赢家，而熊梓淇、王一哲则遗憾出局，…

披荆斩棘4二公揭秘：王铮亮尤长靖赢麻了，熊梓淇王一哲出局(披荆斩棘4二公舞台排名)

2025-08-10

想增强逻辑能力？这些要点你必须知道(想增强逻辑能力的句子)

通过不断对多个案例进行深入研究，我们的逻辑分析能力将得到逐步提升。这些题目有助于增强我们的推理与判断技能，而游戏则让训练过程变得更加轻松愉快。在交流时，力求条理清晰、论据充分；在抉择面前，需进行理智的分析与推…

想增强逻辑能力？这些要点你必须知道(想增强逻辑能力的句子)

2025-08-10

医疗卫生事业的智慧驱动力(医疗卫生事业的根本属性是)

卫生信息管理，绝非简单的数据收集与整理，而是综合运用信息技术、统计学方法、管理学理论，对各类卫生信息资源进行全面、系统的规划、采集、存储、分析、传播与应用，旨在提升医疗卫生服务的效率、质量与可及性，最终改善公…

医疗卫生事业的智慧驱动力(医疗卫生事业的根本属性是)

2025-08-10

蔡澜生前趣谈关之琳：她会把追求者“吃”得连骨头都不剩(蔡澜访谈的节目)

蔡澜在一次采访关之琳的场合中开玩笑地说，周围有男性朋友想追求她，他不仅没有支持那个朋友，反而半开玩笑地威胁关之琳，说：“会把你吃得连骨头都不剩。”对于面对媒体和接受采访，她却持有抵触情绪，她直言：“我已经花了…

蔡澜生前趣谈关之琳：她会把追求者“吃”得连骨头都不剩(蔡澜访谈的节目)

2025-08-11

REDMI K90外观细节曝光：一体冷雕玻璃+大矩阵Deco(红米k90多少钱)

【CNMO科技消息】8月11日，有数码博主爆料称，红米REDMI K90系列新机将配备旗舰同款的一体冷雕玻璃工艺，并采用超大矩阵影像模组设计。根据该博主之前的爆料，REDMI K90系列的硬件配置也很优秀。…

REDMI K90外观细节曝光：一体冷雕玻璃+大矩阵Deco(红米k90多少钱)