谷歌发布Gemini 2.5 Computer Use模型:专攻浏览器交互(谷歌发布Gemini 2.0)

谷歌发布Gemini 2.5 Computer Use模型:专攻浏览器交互(谷歌发布Gemini 2.0)

10 月 8 日消息,谷歌正在预览一款全新的 Gemini 人工智能模型,该模型旨在通过浏览器浏览网络并与之交互,使 AI 智能体能够在原本为人而非『机器人』️设计的用户界面中执行操作。这款名为“Gemini 2.5 计算机使用”(Gemini 2.5 Computer Use)的模型,利用“视觉理解与推理能力”分析用户的请求,并完成相应任务,例如填写并提交表单。

该模型可用于用户界面测试,或用于操作那些仅面向人类用户、未提供 API 或其他直接接口的系统。此前,此类模型已应用于谷歌 AI 模式(AI Mode)中的智能体功能,以及研究原型项目“Mariner”,该项目利用 AI 智能体在浏览器中自主执行任务,例如根据食材清单自动将商品添加到购物车🛒。

谷歌此次发布恰逢 OpenAI 在其年度开发者日(Dev Day)宣布推出 ChatGPT 新应用的次日。OpenAI 正持续聚焦其“ChatGPT 智能体”(ChatGPT Agent)功能,该功能可代表用户完成复杂任务。与此同时,Anthropic 公司已于去年发布了其 Claude AI 模型的“计算机使用”(computer use)版本。

注意到,谷歌发布了一些演示视频,展示了“计算机使用”工具的实际运行效果,并注明视频播放速度已加快至 3 倍。谷歌表示,其计算机使用模型“在多个网页和移动端基准测试中优于现有领先方案”。与 ChatGPT 智能体和 Anthropic 的计算机使用工具不同,谷歌的新 AI 模型仅限于访问浏览器环境,无法操控整个计算机系统。谷歌特别指出,该模型“尚未针对桌面操作系统层级的控制进行优化”,目前支持 13 种操作,包括打开网页浏览器、输入文本,以及拖放页面元素等。

Gemini 2.5 计算机使用模型现已通过 Google AI Studio 和 Vertex AI 向开发者开放。此外,Browserbase 平台也提供了在线演示,用户可实时观看该模型完成诸如“玩一局 2048 游戏”或“浏览 Hacker News 上的热门讨论”等任务。

特别声明:[谷歌发布Gemini 2.5 Computer Use模型:专攻浏览器交互(谷歌发布Gemini 2.0)] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

『迪丽热巴』“新疆才艺美女”代言人!一身民族服装异域风情好戳人!

『迪丽热巴』:新疆文化的代言人,艾德莱斯舞裙展现独特魅力早在《花儿与少年》节目中,她就不遗余力地推介自己的家乡,深情讲述着对新疆文化的热爱,感动了无数人。 汪文斌在当时特别点赞她的表现,称:“『迪丽热巴』自信地向海外…

『迪丽热巴』“新疆才艺美女”代言人!一身民族服装异域风情好戳人!

『戚薇』 G社好离谱(『戚薇』『戚薇』)

『戚薇』巴黎『时装周』造型引发热议,“G社好离谱”为何造成如此争议? 2025年10月5日,『戚薇』在巴黎『时装周』Mugler秀场的造型引发了广泛关注与争议。2025年巴黎『时装周』,『戚薇』的一组生图因“G社好离谱”迅速登上热…

『戚薇』 G社好离谱(『戚薇』『戚薇』)

展会季福田口岸广告拦截深港科技展商(福田口岸什么时候关门)

年均 200 + 场展会的科创流量枢纽,展会季客流特征:福田口岸作为深港河套自贸区核心通道,每年 4-6 月9-11月展会季日均通关科技展商达 3 万人次(较平日增长 67%),其中:香港展商(60…

展会季福田口岸广告拦截深港科技展商(福田口岸什么时候关门)

华中科技大学举办首届校友集体婚礼 73对新人共庆母校73周年(华中科技大学举报电话)

中秋时节,梧桐絮语,丹桂飘香。10月6日,华中科技大学举办首届校友集体婚礼,正值该校建校73周年,73对校友新人在师长、亲友的见证下交换定制戒指💍并浪漫拥吻

华中科技大学举办首届校友集体婚礼 73对新人共庆母校73周年(华中科技大学举报电话)

『窦骁』压根没想到,与何超莲分手10年后,吴克群竟然因一个举动口碑爆增(『窦骁』2021)

说音乐:那首传遍大街小巷的《为你写诗》,一句“为你写诗,为你静止”几乎成KTV标配;给萧亚轩的《错的人》、给『张韶涵』的《讨好》风格各异;2013年春晚,他和《梦想合唱团》宁波队唱《冬天里的一把火》,场面直接被…

『窦骁』压根没想到,与何超莲分手10年后,吴克群竟然因一个举动口碑爆增(『窦骁』2021)