GPT-5,这次是真的要来了!全网的热议已经让人无法忽视。从ChatGPT到MacOS应用程序的模型列表,再到Cursor、微软Copilot和OpenAI API平台,似乎到处都能捕捉到GPT-5的身影。这个风暴似乎已经无可避免,热情和好奇心再次被点燃,连一向“雷霆万钧”的马库斯都说:这次,GPT-5真的是来了!
从泄露的信息来看,GPT-5的强大是显而易见的。它不仅会整合GPT系列和O系列,还能实现多模态和推理能力的高度统一。编程能力强大,百万tokens的上下文支持,以及对MCP的支持,让人期待不已。更重要的是,最快下周,微软Copilot上的GPT-5就要面向所有用户开放,而且没有任何订阅限制。今年3月,奥特曼还曾透露过GPT-5将免费向公众开放的消息。看起来,这一次GPT-5的发布,真的是要全面铺开了!
那么,GPT-5究竟有多强?根据OpenAI内部人士透露,它将把推理能力(O系列)和多模态交互能力(GPT系列、4O)统一在一起,以后再也不需要手动切换模型了。其技术亮点也是令人咋舌,特别是在编程方面。GPT-5(o3-alpha)被曝在高级编程上表现卓越,接近人类程序员水平,可以更快速、精准地完成软件开发工作。它能够自动编写高质量的游戏原型,并支持多种应用程序定制,甚至根据具体需求进行进一步优化。
而在物理领域,GPT-5的表现同样不容小觑,一些zero-shot的demo效果让人惊艳。另一款名为Lobster(迷你版本)的编程模型,号称能超越Claude 4等模型,特别适合一些复杂编码任务。Lobster凭借极少的输入就能快速生成结构完备、功能准确的代码,尤其擅长优化凌乱的遗留代码,甚至能自动清除冗余,并在大型软件项目中管理复杂的依赖关系。
例如,有用户要求Lobster和其他模型一起创建交互式神经网络动画,Lobster一次就完成了任务,生成了带彩色节点的解决方案,而其他模型则在执行过程中出现了错误。而且,Lobster的优势还不止于此,搭载O3系列模型的高级推理能力,它能够在简单任务中迅速反应,在复杂任务中触发深度推理模块,尤其擅长逻辑推理和数学问题的解决。
更令人惊叹的是,Lobster的多模态理解能力,它能够同时执行文本、图像和工具调用等任务。与GPT-4不同,Lobster不再受限于一次只能处理一种输出的限制,它的多步骤组合执行能力让它能够轻松应对各种复杂任务,真正做到了编码、推理和多模态理解的完美融合。
此外,另一款名为Starfish(nano版本)的模型最近也悄然亮相,但测试结果显示它仅能处理静态的小游戏界面,尚无法启动完整的游戏。
除了这些新模型,微软和Cursor也准备火速接入GPT-5。微软正在试行新版Copilot的“Smart模式”或“magicmode”,该模式能够智能判断何时调用GPT-5的深度推理与多模态能力,简化了用户选择模型的步骤。看来,微软很可能会在GPT-5发布后第一时间将其集成到Copilot和Microsoft 365生态中,而Azure也在为此做准备。与此同时,Cursor团队也在进行GPT-5 Alpha版本的内部测试,进一步证明GPT-5的强大能力。
不过,即便如此,有人对GPT-5的表现持怀疑态度。有网友表示,虽然GPT-5可能在发布初期表现出色,但过一段时间就可能变得“不堪重负”,就像之前的所有模型一样。也有观点认为,发布后为了安全考虑,某些功能可能会被限制,导致大家觉得它的强大只是一场炒作。
更“泼冷水”的马库斯也提出了7个悲观预测,指出即使GPT-5真如宣传所说的那样强大,也不一定能避免后续的各种问题。社区内也有类似的看法,大家已经被奥特曼“耍”得太多,很多爆料真假难辨,泄露的GPT-5基准测试数据甚至被认为是“假新闻”。在这种情况下,网友们普遍表示,除了官方消息,谁的说法都不值得信任。
不过,也有网友认为,这些“不小心泄露的”消息,可能是OpenAI在为GPT-5做炒作。总的来说,大家的心情有些复杂,但无论如何,GPT-5就快发布了,大家都等不及了!
—完—