可自主帮人订餐购物,OpenAI首个AI智能体来了

今日霍州(www.jrhz.info)©️

图片来源:界面图库

界面新闻记者 | 『宋佳』楠

AI智能体正在加速尝试代替人类去做一些“力所能及”的事情。

当地时间1月23日,OpenAI发布了首个AI智能Operator。据该公司CEO奥特曼介绍,这款智能体能像人类一样使用网页浏览器,并点击按钮、打字输入内容等,能自动完成预订旅行住宿、餐厅预约、在线购物等复杂任务。

Operator支持个性定制,用户可为特定网页或全站添加自定义指令,并在主页保存,实现跨聊天窗口的多任务处理,如设置订机票时的首选航司等。

从现有体验来看,Operator在基础网页操作和重复性任务方面表现出色,如搜索筛选、创建购物清单和音乐播放列表等任务成功率较高。但在处理复杂的房产搜索等任务时,成功率相对较低;在处理不熟悉的UI界面和文本编辑时表现欠佳。

在发布演示和用户测试中,Operator出现了网页无法成功加载等情况,表明其在运行稳定性上存在不足。此外,由于部分网站可能会屏蔽AI访问,导致智能体无法在这些网站上执行任务,使其应用范围受到一定限制。

据OpenAI方面介绍,这款智能体在WebArena测试中得分58.1%,而在WebVoyager测试中实际网站导航成功率达87%,OSWorld测试的得分则为38.1%。WebArena是由卡耐基梅隆大学等机构推出的一项用于测试智能代理在网络环境中执行任务能力的测试。WebVoyager测试主要在亚马逊、开源网站GitHub和谷歌地图等真实网站上测试模型的性能。而OSWorld测试用于评估模型控制『Windows』和macOS等完整操作系统的能力。

尽管还谈不上完美,但“这款产品是我们进军智能体领域的开始。”奥特曼在直播中这样表示。

可以说,Operator是OpenAI向通用人工智能(AGI)目标迈进的重要一步,也将进一步增强该公司在AI领域的竞争力。但考虑到Operator在代替用户执行任务时可能需要输入敏感信息,如何避免潜在安全风险将成为重要问题。

特别声明:[可自主帮人订餐购物,OpenAI首个AI智能体来了] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

45岁汪小菲机场状态封神!独自提行李笑对粉丝,二婚娶小11岁娇妻,比头婚甜到上头(汪小菲 现状)

这份不矫情、不依附的态度,恰好给了忙碌的汪小菲足够的空间——即便他无暇全程陪伴孕期,马筱梅也毫无怨言,反而始终鼓励支持,这份默契与体谅,是很多感情里都稀缺的存在。好莱坞影星朱莉与皮特的二婚(虽最终分手)、韩国…

45岁汪小菲机场状态封神!独自提行李笑对粉丝,二婚娶小11岁娇妻,比头婚甜到上头(汪小菲 现状)

【行业资讯】上周俄罗斯电商圈发生了哪些大事?(0117-0123)(上海上一)

该服务提供包括专属折扣与额外返现在内的多项优惠,其用户规模在2025年实现快速增长,总数已突破500万。 俄罗斯主要电商平台Ozon和Wildberries已与商品标记系统“诚实标签”的运营商达成合作,将分阶…

【行业资讯】上周俄罗斯电商圈发生了哪些大事?(0117-0123)(上海上一)

被指责攻击哥哥后,贝克汉姆幼子携女友外出,女友长得像母亲(攻击指责挑起争端中方对此作出严正回应)

2026年1月19日,布鲁克林在Instagram上发布了一篇长文,里面有一句爸妈操控媒体毁了我的婚姻,一下子把贝克汉姆家的遮羞布撕得四散,登上了热搜。于是他搬到美国,改了岳父的姓,做饭都要直播,拼命证明我是…

被指责攻击哥哥后,贝克汉姆幼子携女友外出,女友长得像母亲(攻击指责挑起争端中方对此作出严正回应)

『郭晶晶』不再隐瞒!这一次,高调回应争议,代言风波终于真相大白(『郭晶晶』隐蔽处)

更扎心的是,网友一查,这品牌从2025年到现在挨了五次罚,最近一次就在去年12月,违规都成习惯了。合作2022年就结束了,压根没参与后续宣传。这次风波反而让大家看清:她的口碑不是靠霍家光环,是十几年如一日的低…

『郭晶晶』不再隐瞒!这一次,高调回应争议,代言风波终于真相大白(『郭晶晶』隐蔽处)

64岁『张学友』捐出130万!此前被传老婆败光20亿家产狂开演唱会

当他抛出这句失业后,台下立刻爆发出欢呼声,因为大家知道,这不是告别,而是暂时的停顿,是『张学友』给自己换气的时刻。他甚至在舞台上做了一字马,这个动作不仅仅是在炫耀自己的身体,更是用最直观的方式告诉所有人:我还可以…

64岁『张学友』捐出130万!此前被传老婆败光20亿家产狂开演唱会