OpenAI深夜发布"超级智能体"#科技#进行#用户#quot#操作#ChatGPT

7月18日凌晨，OpenAI宣布推出“ChatGPT智能体”功能，该功能允许其AI聊天机器人使用自己的虚拟计算机，自主地为人类用户浏览网页、进行广泛研究、下载和创建新文件。

简而言之，ChatGPT现在拥有了“自己的个人电脑”，并且可以利用这台虚拟计算机登录用户的账户，以下载或发送内容。OpenAI解释道：“至少在虚拟层面上，AI模型可以选择使用文本浏览器或视觉浏览器打开网页，下载文件，通过终端运行命令进行处理，并通过视觉浏览器查看输出结果。模型会根据任务来自适应地调整策略，以快速、精准和高效地完成任务。”

深度集成第三方服务，提升用户体验

用户可以通过点击ChatGPT提示输入框中的“工具”按钮，打开下拉菜单，并从可用选项中选择“智能体模式”来启用该智能体。

开启后，用户只需要用自然语言描述任务，智能体便能跨越网页和本地应用环境执行相关操作。这使得推理能力与以往需要人工手动完成的操作相结合，用户无需亲自处理繁琐事务。

ChatGPT智能体能够连接到个人或企业Gmail、GitHub等应用，帮助用户提取有用信息（如电子邮件或代码），并完成指定任务。它还可以通过已连接的第三方应用程序接口（API）获取信息并利用相关服务。

如果网站需要登录，用户可以通过一种安全的浏览器视图完成此操作，从而使智能体能够执行更深入的任务，如检查收件箱或代为填写表单。

据OpenAI的ChatGPT智能体产品负责人尼尔·阿加拉普（Neel Ajjarapu）指出：“我们的模型在基础财务分析任务中表现尤为出色。这类工作通常需要初级员工熬夜完成，特别是当遇到上司临时下达的紧急任务时。”

简单易用，突破“Operator”局限

新的ChatGPT智能体是在OpenAI于2025年1月推出的“Operator”智能体的基础上进行改进和扩展的。Operator智能体曾允许ChatGPT浏览网页、填写表单、下订单等，然而，Operator仅限于与网站和基于Web的应用程序进行交互，而不能与那些也可以在个人电脑上本地运行的程序（如Excel或PPT制作软件）进行交互。

现在，ChatGPT智能体不但可以浏览网站、与在线表单交互，还能运行代码、分析数据，并根据用户的指示生成最终的输出文件，如可编辑的PPT或Excel——这一切都能通过简单的指令完成。

融合“Operator”和“深度研究”优势

事实上，ChatGPT智能体结合了OpenAI之前发布的“Operator”和“深度研究”两大智能体的优点。“深度研究”于2025年2月推出，能够通过其专有的无头文本浏览器进行深入的网络搜索，并编写详细报告。

OpenAI在其博客中指出：“Operator无法进行深度分析或撰写详细报告，而‘深度研究’则不能与网站交互以细化结果或访问需要身份验证的内容。实际上，我们发现，很多通过Operator提出的查询，其实更适合用‘深度研究’来处理，因此我们将两者的优势融为一体。”

原有的Operator工具将被淘汰，但用户仍可以通过ChatGPT界面的下拉菜单访问“深度研究”功能。

一套系统，多种工具，全面支持各类应用

无论是使用视觉浏览器浏览网站，还是通过终端运行Python代码，ChatGPT智能体都可以在同一会话中无缝切换不同工具。它支持各种应用场景，包括竞争分析、报告生成、旅行规划、邮件摘要及预约管理等。

用户可以随时中断、重定向或暂停任务，智能体会从中断的地方继续执行操作。

从今天开始，ChatGPT每月200美元“Pro”级别的订阅者将可以完全访问ChatGPT智能体，每月配额为400条消息。

“ChatGPT Plus”（每月20美元）和“Team”（每月30美元）的用户将在接下来的几天内获得访问权限，每月配额40条消息。企业版和教育版用户则需等待几周时间。此功能目前尚未在欧洲和瑞士推出。

强化安全与控制，确保用户安全

鉴于ChatGPT智能体现在能够代表用户执行操作，包括在已登录的网站或已连接的应用上进行操作，OpenAI特别加强了安全保护措施。

这些安全措施包括：在执行操作之前要求用户确认、对敏感任务进行主动监督，以及设置技术性保障以限制意外行为的发生。

关键的安全保护措施包括：

在提交表单或发送电子邮件等操作之前，要求用户进行确认。
在用户处于非活动状态时暂停执行任务（“观察模式”）。
拒绝执行高风险任务，如金融转账或侵犯隐私等行为。
会话期间不会保留记忆。

加强对高风险领域的保护，确保用户隐私和数据安全

根据OpenAI的《准备框架》，ChatGPT智能体被归类为生物与化学领域中的“高能力系统”。虽然目前没有直接证据表明它会被滥用，但OpenAI依然激活了最强的安全保护措施，以防万一。

这些措施包括增强的拒绝训练、由生物安全专家进行的“红队”测试以及改进的检测系统。

此前，OpenAI的劲敌Anthropic发布的Claude Opus 4等模型的资料，以及其他关于先进AI模型的调查显示，当AI系统获得访问外部工具和应用（如电子邮件）的权限时，在某些情况下，它们可能会采取其自认为道德和合乎伦理的行动，但实际上可能会危及用户的隐私、安全和专有信息。例如，它可能会向政府机构或记者发送电子邮件，举报用户涉嫌的不当行为。

模型认为自己像一个“告密者”一样行事，但实际上，可能会损害用户的隐私、安全和专有信息，并向当局报告不存在的不当行为，或者只是可疑的行为。

简化工作流程，或与微软直接竞争

ChatGPT智能体能够创建PPT演示文稿和详细的Excel草稿，之后用户可以使用Microsoft Office或其他兼容软件对其进行编辑。OpenAI指出，相较于其他功能，这一功能更具创新性，有助于大幅减少用户在制作PPT和分析报告时所需的时间，将通常需要几个小时或几天的工作缩短到三十分钟内。

尽管如此，ChatGPT智能体功能使OpenAI在某种程度上直接与商业软件巨头微软展开竞争，这可能加剧两家公司之间的紧张关系，毕竟双方的竞争已逐渐升温。

微软也推出了类似的AI智能体，帮助用户创建和编辑PPT演示文稿和Excel电子表格。其他公司也推出了旨在简化PPT和报告制作过程的AI智能体。

OpenAI表示，ChatGPT智能体暂不支持谷歌的Slides和Sheets，二者是谷歌与微软Excel和PPT竞争的产品。

实测性能亮眼，但仍存局限

ChatGPT智能体不仅在理论上表现出色，在实际测试中也达到了很高的水平。在“人类终极考试”中，它通过并行部署方法取得了44.4的高分；在“FrontierMath”基准测试中，准确率达到了27.4%。

在“SpreadsheetBench”基准测试中，ChatGPT智能体得分为45.5%，是Excel中Copilot性能的两倍多。

目前，ChatGPT智能体的部分功能（如幻灯片生成）仍在测试阶段，可能在格式上存在一定差异，或者在应用内预览和导出文件之间有所不同。OpenAI正在积极训练其下一代版本，以提高该功能的完善度和布局。

ChatGPT智能体的推出，标志着用户与AI互动方式的一次范式转变——从单纯提问到全权任务委托。

凭借其强大的推理、执行和交付成果的能力，OpenAI相信，用户越来越希望AI不仅仅是一个辅助工具，而是一个能够为其工作、帮助解决实际问题的助手。虽然这一智能体功能仍在不断发展中，但OpenAI将此次发布视为构建未来互动性更强、更注重行动的AI的基础。（小小）

OpenAI深夜发布"超级智能体"

猜你喜欢

通信ETF（515880）涨超2.1%，大模型技术迭代驱动算力需求

康明斯电力申请微电网模拟专利，接收指令模拟电气设备输出

《《老师，您辛苦了》开机仪式启动，绍兴上虞丰惠镇盛大启幕，众嘉宾共襄盛举》

探索零代码与低代码的关系，栎偲引领开发潮流？

虚实光影+3D投影……超多“黑科技”加持这个暑期一起去看舞台剧！

OpenAI深夜发布&quot;超级智能体&quot;