让 AI 成为“操作系统”已不再是概念,正成为现实。
最近,OpenAI首席执行官Sam Altman在今年的开发者大会(OpenAI DevDay 2025)上直言:我们正在为智能打造操作系统。
要知道,距离首届开发者日仅仅两年,而OpenAI的生态规模已实现爆炸式增长:
开发者数量从200万翻倍至400万,ChatGPT周活跃用户从1亿飙升至8亿,API每分钟处理的token数量更是增长20倍达到60亿。
但这组数字背后,是OpenAI更为深刻的战略布局。ChatGPT已不再仅仅是聊天工具,而正在成为AI操作系统的终极入口。
OpenAI 生态野心:从工具到平台看完整场大会,Apps SDK功能,可以说最值得关注。
Altman在大会上介绍Apps SDK时表示:当我们的应用CEO Fidji Simo第一次看到这个功能时,她说“这简直无法想象”。
这一被外界视为本次发布会最重磅的更新,标志着OpenAI正式从AI工具提供商向生态平台构建者转变。
Apps SDK的本质是一套完整的开发框架,允许第三方应用深度集成到ChatGPT中。
与简单的插件不同,集成后的应用可以在ChatGPT内部完全运行并呈现交互界面,用户无需跳转即可完成复杂操作。
现场演示极具说服力:当用户输入“为宠物狗业务设计海报”时,只需“@”Canva,ChatGPT便能理解上下文,直接调出Canva的设计界面,生成多款符合要求的海报。
整个过程无缝衔接,仿佛Canva本就是ChatGPT的一部分。
再比如,用户想要找房子,ChatGPT会建议考虑“匹兹堡”市场,并自动唤起Zillow应用,展示带院子的房源信息。
应用间的壁垒被彻底打破,它们在同一对话中协同工作,为用户提供连贯的服务体验。
这种深度集成的意义远超技术本身——它重新定义了软件如何使用。
传统模式下,用户需要在不同应用间切换;而在新范式下,用户始终停留在一个对话界面中,各种应用能力如影随形。
AgentKit:8分钟构建复杂智能体“能够为你工作的系统,我们称之为智能体。”Altman给出了OpenAI对智能体的明确定义。
为降低智能体开发门槛,OpenAI推出了AgentKit可视化开发平台。
OpenAI平台体验部门负责人Christina Huang的现场演示:她仅用8分钟就搭建了一个完整的智能体。
通过拖拽节点、配置参数,无需编写任何代码,一个能理解用户意图并准确回答问题的智能体便宣告完成。
AgentKit 包含三个核心组件:
提供可视化画布的Agent Builder、管理数据连接器的Connector Registry,以及用于嵌入定制聊天界面的ChatKit。三者结合,使智能体开发如搭积木般简单直观。
这一平台还提供了评估智能体能力的Eval指标系统,从数据集、跟踪评分、自动化提示和第三方模型支持四个维度,确保智能体的可靠性和实用性。
企业级应用案例展示:连锁超市Albertsons使用类似工具构建了销售分析智能体,可直接询问“如何提高冰淇淋销量”并获得数据驱动的决策建议。
AI 正从辅助工具演变为核心生产力。
Codex:自然语言即代码“我们内部每周70%的代码提交由Codex完成。”Altman透露的这一数据,昭示着软件开发正经历根本性变革。
更令人惊讶的是,构建AgentKit可视化工具本身仅用了6周时间——而这工具恰恰是用来替代部分编码工作的。
随着Codex结束预览进入通用可用阶段,软件开发的门槛被前所未有地降低。
OpenAI开发者负责人Romain Huet的现场演示将这一趋势展现得淋漓尽致:
他试图控制一台索尼FR7相机📷️,面对复杂的C++ SDK,Codex提出了基于VISC协议的更优雅解决方案。几分钟内,它不仅生成了Node『服务器』代码,还解析了UDP数据包结构,甚至发现了特定型号的特殊头部信息。
随后,集成Xbox手柄控制、语音指令操作等功能相继实现。当Huet说出“将灯光聚焦到观众席”时,会场灯光应声而动,精准照亮观众区域。整个过程未手写一行代码,全部通过自然语言指令完成。
这些案例印证了Altman的观点:它将最复杂的编码难题简化为自然语言指令,唯一的限制就是你的想象力。
三大模型:技术底座全面升级为支撑这一宏大的生态愿景,OpenAI同步升级了其技术底座。
GPT-5 Pro API正式开放,这款被称为“最智能”的模型在指令遵循和复杂任务处理上表现卓越,特别适合金融、法律、医疗等高精度需求场景。
Sora 2 API的开放意味着顶级视频生成能力现已触手可及。现场展示的Mattel案例中,简单手绘草图被实时转化为带材质和色彩的3D产品草案,预示着创意产业即将迎来效率革命。
同时推出的gpt-realtime-mini语音模型,在保持语音质量和性能的前提下,成本降低70%,为语音交互的大规模普及铺平道路。
Altman强调,就我个人而言,我认为语音将成为人们与AI交互的主要方式之一。
OpenAI 生态战略的深层逻辑OpenAI的这一系列动作,透露出清晰的战略意图:构筑以ChatGPT为核心的操作系统级生态。
与传统操作系统不同,AI操作系统的交互基础是自然语言,应用形态从孤立的功能模块转变为随时可调用的能力集合。用户不再需要寻找应用,而是通过对话自然唤起所需功能。
这种范式转移对软件产业影响深远:
开发重心从功能实现转向场景理解:应用价值不再取决于功能多寡,而在于它能否在恰当时机提供恰当服务。
用户习惯从主动寻找变为自然表达:应用发现机制从应用商店浏览变为对话中的智能推荐。
竞争壁垒从技术优势转向生态协同:单一应用难以独立生存,融入生态成为必然选择。
然而,这一愿景仍面临挑战。欧盟因监管问题被排除在Apps SDK预览计划之外,表明区域监管差异可能成为生态扩展的障碍。同时,应用深度集成带来的数据安全和隐私问题也需要妥善解决。
未来入口的争夺“我们正见证一个前所未有的时代。”Altman在演讲中感慨道,“曾几何时,开发一款软件需要数月甚至数年。而今天,有了AI,一个想法可以在几分钟内落地成型。”
开发者不再需要一个庞大的团队,只需一个好的创意,就能超越以往的速度,将灵感变为现实。
从聊天界面到操作系统,ChatGPT的演变标志着AI正从回答问题走向改变世界。
当自然语言成为人机交互的主要方式,当应用能力如水电般随时可取,当创意到实现的路径被大大的压缩,我们看到的不仅是技术的进步,更是数字文明的演进方向。
操作系统的终极形态,或许从来都不是管理硬件资源的软件,而是连接人类与数字世界的智能接口。
在这场未来入口的争夺中,OpenAI已掷出有力的筹码,而更大的变革,才刚刚开始。