Agent AI 时代,似乎比我们想象中来得要早一些...
北京时间周五凌晨,OpenAI 突然开启了新产品直播。
长久以来,ChatGPT 作为一款强大的语言模型,
凭借出色的语言理解与生成能力,在自然语言处理领域独树一帜。
它如同一位知识渊博的挚友,有问必答。
但 ChatGPT Agent 的出现,
彻底打破了这种固有认知,带来了一场从量变到质变的飞跃。
OpenAI CEO 山姆・奥特曼(Sam Altman)表示:
「观看 ChatGPT 智能体使用计算机执行复杂任务对我来说是一个真正的“感受 AGI”的时刻,看到计算机思考、计划和执行会带来不同的感受。」
本次发布的是全新的 ChatGPT Agent,它实现了通用智能体(Agent)能力的关键升级。
相比于传统 ChatGPT 聚焦于语言层面,根据输入文本生成回应,局限在虚拟的语言交流范畴。
ChatGPT Agent 实现了从 “语言理解” 到 “任务理解” 的跨越,
拥有更广阔的视野与强大的执行能力。
它不再满足于纸上谈兵式的对话,而是能深入理解用户复杂意图,
将抽象指令转化为具体可执行的任务,并凭借自身智能规划,
有条不紊地推进任务直至完成,真正实现从 “能说” 到 “能做” 的蜕变。
ChatGPT Agent现在可以使用自己的虚拟电脑为你完成工作,从头到尾处理复杂任务。
用户只需向 ChatGPT 简单发出一句指令:“帮我安排婚礼当天需要准备的所有事项”,
它就能联网收集大量信息、比对最佳方案,并自动生成一份结构清晰、贴合预算、涵盖各环节的婚礼准备报告。
除了处理工作任务和文档资料,ChatGPT Agent 在日常生活中的表现同样令人惊艳。
厉害的是,对于一位 MLB 棒球迷来说,
你只需简单地发出一句话:“帮我整理本周的 MLB 比赛安排”,
Chatgpt Agent 就能自动搜索最新赛程,
提取出每一场比赛的时间、主客场信息、对应球馆的位置,
甚至还能推荐当地球迷热衷打卡的特色小吃——是洛杉矶道奇球场的 Dodger Dog,还是西雅图球场的蒜香薯条和三文鱼汉堡?
它都能一一列出,并附带球场平面图与周边导航信息。
更酷的是,Agent 还具备可视化生成能力。
如果你计划跟着喜欢的球队跨城追赛,
它能基于赛程自动绘制一张飞行路线图,
展示城市间的移动路径、距离、建议出发时间,帮你把行程规划得有条不紊。
过去需要打开五个网页、查票、查地图、找美食,现在一句话就能完成。
Operator 与深度研究的自然进化
过去,Operator 和 deep research 各自具备独特优势:
Operator 能够在网页上滚动、点击和输入,而 deep research 擅长分析和总结信息。
不过,二者在不同场景下才能发挥最大作用,各有不擅长的领域。
Operator 无法深入分析或撰写详细报告,
而 deep research 又无法与网页交互、进一步筛选结果或访问需要用户登录的内容。
通过将这些互补能力集成进 ChatGPT,
并引入更多工具,OpenAI 在一个模型中解锁了全新的能力。
它现在可以主动与网站交互 —— 点击、筛选并收集更精准、高效的结果。
用户也可以在同一个对话中,从自然的交流无缝过渡到发出具体操作请求。
ChatGPT Agent 可以根据需要选择用文本浏览器或可视化浏览器打开网页,
从网上下载文件,在终端中运行命令处理文件,然后再通过可视化浏览器查看输出结果。
同时也会根据任务调整策略,以快速、准确和高效地执行。
让我们亲身体验一下
至于这款 Agent 是否好用,不少网友现身说法。
X 网友 @rowancheung 提前获得访问权限,并让 ChatGPT Agent 在 20 分钟内为他创建一个完整的提前退休计划。
拿到任务,ChatGPT Agent 就开始查找温哥华的当地税法、分析平均每月支出率、计算 30 岁退休所需的储蓄金额、研究最佳投资分配,还发现了 Rowan 从未听说过的税务优化策略、构建多种财务独立提前退休(FIRE)场景,最终创建一个可下载的演示文稿,总结结果。
尽管 ChatGPT Agent 展示了面向个人用户的惊艳体验,
但暂未向企业级场景进发。
在企业级场景中,
适合中国企业的Agent 路径可能有所不同。
以中国领先的智能自动化平台 实在智能 为例,
其智能 Agent 战略布局兼顾 C 端与 B 端的双向布局,
在实际落地场景中展现出多层次、多维度的能力体系。
面向 C 端用户,实在Agent接入了DeepSeek等主流AI模型,
推出了多个低门槛的 AI 工具,
如采集网页信息生成分析报告、生成旅游规划等,
帮助普通用户轻松完成数据处理、文档生成、自动翻译等日常任务;
面向 企业级客户,
则融合 RPA机器人流程自动化、ISSUT智能屏幕语义理解与LLM大语言模型,
构建高度结构化、流程闭环的业务型实在 Agent。
它可以接入财务系统、ERP、CRM、OA 等核心平台,
操作桌面上任意APP/软件
实现批量任务处理、数据核对、自动填报、客服对话等业务流的智能接管。
在实际应用中,实在智能与4000+世界五百强以及央国企达成合作。
比如前段时间冲上热搜的深圳 AI 公务员,
龙岗区作为广东省首个 “尝鲜” 结合 DeepSeek 等大模型的政府部门,
被央视点名表扬!
其中,龙岗区在统计局上岗的 “AI 公务员” 就是实在 Agent
还入选了《高质量数字化转型典型案例》
对于AI Agent,执行能力则是关键的“最后一公里”。
传统自动化方案常因软件API限制而卡壳,
而新一代智能体如实在Agent(RPA Agent)实现了革命性突破:
它能像真人一样直接操作任意软件的图形界面,彻底摆脱API依赖。
更颠覆性的是其“一句话生成自动化流程”的能力。
用户只需自然语言描述目标(如“监控竞品价格并在低于指导价时报警”),
它便自动生成完整操作链——打开电商页面、定位价格元素、设置触发条件、发送预警通知。
这种“所想即所得”的交互模式,将自动化开发从专业领域推向全民化。