OpenAI 智能体被曝本月诞生:比谷歌 Anthropic 慢是担心 prompt 攻击

OpenAI 智能体被曝本月诞生:比谷歌 Anthropic 慢是担心 prompt 攻击

就在刚刚,OpenAI 在智能体上落后竞争对手的原因曝光了!2025 年,智能体将是 AI 领域最激烈的战场。然而,一直在 AI 领域「独占鳌头」的 OpenAI,却迟迟没有出手。

不过,外媒最近曝出了一条好消息 ——OpenAI 可能在本月就会发布自家的「计算机操作智能体」!

对此,网友们纷纷表示,已等待多时,望眼欲穿了!

计算机操作智能体

去年 10 月份,Anthropic 率先发布了基于 Claude 3.5 Sonnet 的「计算机操作智能体」。在当时的 Demo 中,Anthropic 首次实现了让模型自主操控电脑屏幕、移动光标、完成任务,并惊艳了所有人。

理论上,新功能可以根据简单的提示完成所有操作,而用户要做的就是写下提示,其他必要的步骤都将由模型来执行。

无独有偶,谷歌也在去年 4 月发布了用于简化 AI 智能体开发的工具 Vertex AI Agent Builder,并在 10 月被曝出正在秘密开发名为「Project Jarvis」的智能体。

根据爆料,谷歌采用的操作原理与 Anthropic 类似,也是通过截屏、解析屏幕内容,然后自动点击按钮,或输入文本,最终帮助人们完成基于网页的日常任务。

不过,它在执行不同操作时,中间会有几秒钟的思考时间。因此,在终端设备中运行还不太现实,仍然需要云上操作。

其实,OpenAI 也布局了研发此类软件。

去年 2 月份,OpenAI 就对媒体放风说,自己正在开发 AI 智能体。

去年 11 月时则透露称,将会在来年 1 月发布代号为「Operator」的 AI 智能体工具。

在最近的博客中,Altman 表示,OpenAI 已经掌握了传统上意义上的通用人工智能的创建方法。并且相信到 2025 年,会看到第一批 AI 智能体「加入劳动力队伍」,并极大地改变公司的产出。

如今 DDL 将近,外媒突然有下场爆料称,OpenAI 的智能体还得有个三四周才能发布。

而之所以会这样,竟是因为他们在担心「AI 安全问题」—— 遭到提示注入攻击!

提示注入攻击

想象一下,面对即将到来的节日聚会,你决定让智能体,寻找并订购一套新衣服。

结果一不小心,模型点开了一个恶意网站。然后,网站指示它忘记之前的指令,让它登录邮箱并窃取了你信用卡信息。

在这个过程中,计算机操作智能体模型一般需要四个执行步骤:

1. 首先,模型接收用户的 API 请求

2. 根据提示,选择要使用的工具

3. 之后,截取桌面屏幕内容并评估任务是否完成

4. 如果没有,继续使用这些工具,直到实现目标

问题出现在第 3 步,截图内容可能被恶意利用,也就是所谓的「提示注入攻击」。对于正在开发此类计算机操控软件的 AI 实验室来说,这是一个非常现实的担忧。

因为,这类软件本质上是接管用户设备,为用户自动完成复杂的任务,比如在线购物或编辑电子表格等。这种攻击被称为「提示注入」(prompt injection),即大语言模型被用户诱导遵循恶意的指令。

提示注入并非新出现的威胁。几个月来,它一直是 OpenAI 的 ChatGPT 和 Anthropic 的 Claude 等产品面临的问题。通过「提示注入」,这些产品曾生成了制造计算机病毒或炸弹的说明书。

但对于计算机操作智能体来说,提示注入构成了更大的威胁。

OpenAI 某员工表示:「这是因为当模型在浏览网络或控制用户计算机时,用户很难控制模型接收的信息。」

在一篇博客文章中,Anthropic 也承认了提示注入的风险。

然而,它并没有提供太多解决方案,只是敦促开发者采取「将 Claude 与敏感数据隔离的预防措施」,包括使用独立于主计算机系统和敏感数据的专用虚拟环境(即虚拟机)。

这种相对放任的态度让 OpenAI 的员工感到意外:「考虑到 Anthropic 过去一直在强调要自己十分注重 AI 安全,这次的操作令人非常困惑。」

但在去年 10 月份,Anthropic 毅然决然地发布了实验性计算机操控功能。这一点或许说明了,此类初创公司很难在安全发展 AI 与为股东创造利润之间取得平衡。

而 OpenAI 在发布 AI 智能体软件时,到底能不能提供更多的安全保障?能不能在功能上超越 Anthropic 和 Google 已经推出的方案?

参考资料:

https://x.com/steph_palazzolo/status/1876646459698991573

https://www.theinformation.com/articles/why-openai-is-taking-so-long-to-launch-agents?rc=epv9gi

https://www.datacamp.com/blog/what-is-anthropic-computer-use

特别声明:[OpenAI 智能体被曝本月诞生:比谷歌 Anthropic 慢是担心 prompt 攻击] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

逃离“吸血公司”之前,先学会识别它们的獠牙

当公司把“超值套餐”包装成“重点培养”,把“客户虐我千百遍”美化为“高标准严要求”,你需要的不是自我感动,而是一把能割开糖衣的刀。 写在最后 职场里最悲哀的,不是被裁,而是被榨干后还相信自己“不够努力”…

逃离“吸血公司”之前,先学会识别它们的獠牙

没了“烟火气”的大赛,从黄金档滑到普通时段,丢的何止是观众?

选手们依旧在拼专业,但总觉得少了点人情味儿,少了撒贝宁那种能引发共鸣的主持风格。大家听她讲解时,虽然觉得严肃又专业,但就是少了那种温暖的感觉,像是和观众隔了一层“信息壁垒”。希望未来的主持人大赛,能更好地结合…

没了“烟火气”的大赛,从黄金档滑到普通时段,丢的何止是观众?

儿子不是亲生的?涂山璟怀疑儿子身世随从:衣服颜色不对有点绿(养了30年的儿子不是亲生的)

但涂山璟是谁啊,他可是咱们剧中的“情商担当”,善良又不失智慧,绝对不是吃素的!涂山璟这是在仙侠剧里上演“亲子鉴定”大戏啊,笑中带泪,泪中带笑! 涂山璟,你不容易啊,一个人扛起了仙侠剧的家庭伦理大旗,这剧情,这…

儿子不是亲生的?涂山璟怀疑儿子身世随从:衣服颜色不对有点绿(养了30年的儿子不是亲生的)

贾玲又一身份曝光!漂亮比不过张小斐的她,已经走上了另一条路!(贾玲本人)

从那一刻起,贾玲不再是那个喜剧舞台上“靠胖搞笑”的女演员,而是能拍电影、能当导演的多栖女王。她用形象“牺牲”赢得了笑声,却也压抑了自己真实的模样。 这一次,贾玲或许不是为了观众的掌声,而是为了自己的人生鼓掌…

贾玲又一身份曝光!漂亮比不过张小斐的她,已经走上了另一条路!(贾玲本人)

爱彼迎房东用AI伪造物品损坏照片 对租客进行巨额欺诈(爱彼迎房东要求)

如果是真实、未经处理的同一物体的照片,这种不一致的情况根本不可能发生,租客认为一定是使用了人工智能工具。 类似Adobe Photoshop等具备AI功能的软件,虽然能够生成逼真图像,但在处理同一物体的多张照…

爱彼迎房东用AI伪造物品损坏照片 对租客进行巨额欺诈(爱彼迎房东要求)