OpenAI深夜发布"超级智能体"

OpenAI深夜发布"超级智能体"

7月18日凌晨,OpenAI宣布推出“ChatGPT智能体”功能,该功能允许其AI聊天机器人使用自己的虚拟计算机,自主地为人类用户浏览网页、进行广泛研究、下载和创建新文件。

简而言之,ChatGPT现在拥有了“自己的个人电脑”,并且可以利用这台虚拟计算机登录用户的账户,以下载或发送内容。OpenAI解释道:“至少在虚拟层面上,AI模型可以选择使用文本浏览器或视觉浏览器打开网页,下载文件,通过终端运行命令进行处理,并通过视觉浏览器查看输出结果。模型会根据任务来自适应地调整策略,以快速、精准和高效地完成任务。”

深度集成第三方服务,提升用户体验

用户可以通过点击ChatGPT提示输入框中的“工具”按钮,打开下拉菜单,并从可用选项中选择“智能体模式”来启用该智能体。

开启后,用户只需要用自然语言描述任务,智能体便能跨越网页和本地应用环境执行相关操作。这使得推理能力与以往需要人工手动完成的操作相结合,用户无需亲自处理繁琐事务。

ChatGPT智能体能够连接到个人或企业Gmail、GitHub等应用,帮助用户提取有用信息(如电子邮件或代码),并完成指定任务。它还可以通过已连接的第三方应用程序接口(API)获取信息并利用相关服务。

如果网站需要登录,用户可以通过一种安全的浏览器视图完成此操作,从而使智能体能够执行更深入的任务,如检查收件箱或代为填写表单。

据OpenAI的ChatGPT智能体产品负责人尼尔·阿加拉普(Neel Ajjarapu)指出:“我们的模型在基础财务分析任务中表现尤为出色。这类工作通常需要初级员工熬夜完成,特别是当遇到上司临时下达的紧急任务时。”

简单易用,突破“Operator”局限

新的ChatGPT智能体是在OpenAI于2025年1月推出的“Operator”智能体的基础上进行改进和扩展的。Operator智能体曾允许ChatGPT浏览网页、填写表单、下订单等,然而,Operator仅限于与网站和基于Web的应用程序进行交互,而不能与那些也可以在个人电脑上本地运行的程序(如Excel或PPT制作软件)进行交互。

现在,ChatGPT智能体不但可以浏览网站、与在线表单交互,还能运行代码、分析数据,并根据用户的指示生成最终的输出文件,如可编辑的PPT或Excel——这一切都能通过简单的指令完成。

融合“Operator”和“深度研究”优势

事实上,ChatGPT智能体结合了OpenAI之前发布的“Operator”和“深度研究”两大智能体的优点。“深度研究”于2025年2月推出,能够通过其专有的无头文本浏览器进行深入的网络搜索,并编写详细报告。

OpenAI在其博客中指出:“Operator无法进行深度分析或撰写详细报告,而‘深度研究’则不能与网站交互以细化结果或访问需要身份验证的内容。实际上,我们发现,很多通过Operator提出的查询,其实更适合用‘深度研究’来处理,因此我们将两者的优势融为一体。”

原有的Operator工具将被淘汰,但用户仍可以通过ChatGPT界面的下拉菜单访问“深度研究”功能。

一套系统,多种工具,全面支持各类应用

无论是使用视觉浏览器浏览网站,还是通过终端运行Python代码,ChatGPT智能体都可以在同一会话中无缝切换不同工具。它支持各种应用场景,包括竞争分析、报告生成、旅行规划、邮件摘要及预约管理等。

用户可以随时中断、重定向或暂停任务,智能体会从中断的地方继续执行操作。

从今天开始,ChatGPT每月200美元“Pro”级别的订阅者将可以完全访问ChatGPT智能体,每月配额为400条消息。

“ChatGPT Plus”(每月20美元)和“Team”(每月30美元)的用户将在接下来的几天内获得访问权限,每月配额40条消息。企业版和教育版用户则需等待几周时间。此功能目前尚未在欧洲和瑞士推出。

强化安全与控制,确保用户安全

鉴于ChatGPT智能体现在能够代表用户执行操作,包括在已登录的网站或已连接的应用上进行操作,OpenAI特别加强了安全保护措施。

这些安全措施包括:在执行操作之前要求用户确认、对敏感任务进行主动监督,以及设置技术性保障以限制意外行为的发生。

关键的安全保护措施包括:

  • 在提交表单或发送电子邮件等操作之前,要求用户进行确认。
  • 在用户处于非活动状态时暂停执行任务(“观察模式”)。
  • 拒绝执行高风险任务,如金融转账或侵犯隐私等行为。
  • 会话期间不会保留记忆。

加强对高风险领域的保护,确保用户隐私和数据安全

根据OpenAI的《准备框架》,ChatGPT智能体被归类为生物与化学领域中的“高能力系统”。虽然目前没有直接证据表明它会被滥用,但OpenAI依然激活了最强的安全保护措施,以防万一。

这些措施包括增强的拒绝训练、由生物安全专家进行的“红队”测试以及改进的检测系统。

此前,OpenAI的劲敌Anthropic发布的Claude Opus 4等模型的资料,以及其他关于先进AI模型的调查显示,当AI系统获得访问外部工具和应用(如电子邮件)的权限时,在某些情况下,它们可能会采取其自认为道德和合乎伦理的行动,但实际上可能会危及用户的隐私、安全和专有信息。例如,它可能会向政府机构或记者发送电子邮件,举报用户涉嫌的不当行为。

模型认为自己像一个“告密者”一样行事,但实际上,可能会损害用户的隐私、安全和专有信息,并向当局报告不存在的不当行为,或者只是可疑的行为。

简化工作流程,或与微软直接竞争

ChatGPT智能体能够创建PPT演示文稿和详细的Excel草稿,之后用户可以使用Microsoft Office或其他兼容软件对其进行编辑。OpenAI指出,相较于其他功能,这一功能更具创新性,有助于大幅减少用户在制作PPT和分析报告时所需的时间,将通常需要几个小时或几天的工作缩短到三十分钟内。

尽管如此,ChatGPT智能体功能使OpenAI在某种程度上直接与商业软件巨头微软展开竞争,这可能加剧两家公司之间的紧张关系,毕竟双方的竞争已逐渐升温。

微软也推出了类似的AI智能体,帮助用户创建和编辑PPT演示文稿和Excel电子表格。其他公司也推出了旨在简化PPT和报告制作过程的AI智能体。

OpenAI表示,ChatGPT智能体暂不支持谷歌的Slides和Sheets,二者是谷歌与微软Excel和PPT竞争的产品。

实测性能亮眼,但仍存局限

ChatGPT智能体不仅在理论上表现出色,在实际测试中也达到了很高的水平。在“人类终极考试”中,它通过并行部署方法取得了44.4的高分;在“FrontierMath”基准测试中,准确率达到了27.4%。

在“SpreadsheetBench”基准测试中,ChatGPT智能体得分为45.5%,是Excel中Copilot性能的两倍多。

目前,ChatGPT智能体的部分功能(如幻灯片生成)仍在测试阶段,可能在格式上存在一定差异,或者在应用内预览和导出文件之间有所不同。OpenAI正在积极训练其下一代版本,以提高该功能的完善度和布局。

ChatGPT智能体的推出,标志着用户与AI互动方式的一次范式转变——从单纯提问到全权任务委托。

凭借其强大的推理、执行和交付成果的能力,OpenAI相信,用户越来越希望AI不仅仅是一个辅助工具,而是一个能够为其工作、帮助解决实际问题的助手。虽然这一智能体功能仍在不断发展中,但OpenAI将此次发布视为构建未来互动性更强、更注重行动的AI的基础。(小小)

猜你喜欢

通信ETF(515880)涨超2.1%,大模型技术迭代驱动算力需求

通信ETF跟踪的是通信设备指数,该指数由中证指数有限公司编制,从A股市场中选取涉及通信网络设备、终端设备等领域的上市公司证券作为指数样本,以反映通信设备行业相关上市公司证券的整体表现。文中提及指数仅供参考,…

通信ETF(515880)涨超2.1%,大模型技术迭代驱动算力需求

康明斯电力申请微电网模拟专利,接收指令模拟电气设备输出

金融界2025年7月17日消息,国家知识产权局信息显示,康明斯电力公司申请一项名为“微电网模拟”的专利,公开号CN120319102A,申请日期为2025年01月。 专利摘要显示,本申请涉及微电网模拟。本技术…

康明斯电力申请微电网模拟专利,接收指令模拟电气设备输出

《《老师,您辛苦了》开机仪式启动,绍兴上虞丰惠镇盛大启幕,众嘉宾共襄盛举》

随着背景板上“致敬每一位点亮成长之路的师者”字样在雨雾中愈显灵动,主创团队与嘉宾的到场恰在雨停时分,阳光洒落,仿佛是为这场仪式送上了特别的祝福。 本次开机仪式用简洁的流程蕴含了深意,而这雨晴相伴的自然现象更为…

《《老师,您辛苦了》开机仪式启动,绍兴上虞丰惠镇盛大启幕,众嘉宾共襄盛举》

探索零代码与低代码的关系,栎偲引领开发潮流?

零代码开发对用户的技术要求几乎为零,只要具备基本的计算机操作技能,就可以使用零代码开发平台创建应用。栎偲作为零代码与低代码领域的优秀品牌,凭借其强大的产品功能、易于使用的操作界面、安全可靠的性能和持续创新的…

探索零代码与低代码的关系,栎偲引领开发潮流?

虚实光影+3D投影……超多“黑科技”加持 这个暑期一起去看舞台剧!

这个暑期,多部舞剧、儿童剧等演出,通过融合科技元素的全新舞台呈现,满足不同类型的观演需求,吸引年轻观众走进剧场。 该剧充分运用XR创新数字技术与人工智能技术,突破传统舞台时空限制,构建出虚实相生的奇幻场景,吸…

虚实光影+3D投影……超多“黑科技”加持 这个暑期一起去看舞台剧!