谷歌Gemini 2.5 Pro挑战成功!29年前《宝可梦蓝》被AI通关

谷歌Gemini 2.5 Pro挑战成功!29年前《宝可梦蓝》被AI通关

谷歌的人工智能领域传来振奋人心的消息,其最新研发的Gemini 2.5 Pro模型在一款经典电子游戏中取得了历史性成就——成功攻克了发布于29年前的《宝可梦蓝》。

这一突破性进展由谷歌首席执行官桑达尔·皮查伊在社交媒体上激动宣布:“真是令人惊叹!Gemini 2.5 Pro已经成功通关《宝可梦蓝》!”这场名为“Gemini Plays Pokemon”的直播活动,由一位非谷歌员工的30岁软件工程师Joel Z发起,却获得了谷歌高层的鼎力支持。

据悉,早在直播活动前一个月,谷歌AI Studio的产品负责人洛根·基尔帕特里克就已透露,Gemini在《宝可梦》系列游戏上取得了显著进展,并已斩获第五个徽章。相比之下,当前表现第二的模型仅获得三个徽章,尽管它们使用的是不同的代理框架。皮查伊还幽默地表示:“我们正在研发API,即‘人工宝可梦智能’。”

为何谷歌选择《宝可梦》作为挑战对象?这背后有其深意。早在今年2月,Anthropic公司便展示了其Claude AI模型在《宝可梦红》中的卓越表现,强调Claude的“深度思考和代理训练”能力使其在处理复杂任务时更具优势。然而,尽管Claude表现出色,却似乎未能完全通关《宝可梦红》。这是否意味着Gemini在游戏领域的能力更胜一筹?对此,Joel Z在Twitch页面上提醒观众:“请勿将此次成就视为衡量大型语言模型(LLM)在《宝可梦》游戏中表现的唯一标准。Gemini和Claude使用不同的工具和接收到的信息差异较大,因此无法进行直接比较。”

值得注意的是,两款AI模型在玩游戏时都需要借助代理框架。这些框架为模型提供带有额外信息的游戏截图,帮助模型做出决策,并按下与AI指令相对应的按钮。尽管在帮助Gemini完成游戏的过程中,Joel Z进行了一些“开发干预”,但他坚称这并非作弊,而是为了提升Gemini的整体决策和推理能力。

“我的干预并未涉及给出具体提示词或为特定挑战提供攻略或直接指令。”Joel Z解释道,“唯一接近这种情况的是,我告诉Gemini需要与火箭队小兵对话两次才能获得升空钥匙,这实际上是一个在《宝可梦黄》中被修复的漏洞。”他进一步表示,“Gemini Plays Pokémon仍在积极开发中,其框架也在不断演进和完善。”

特别声明:[谷歌Gemini 2.5 Pro挑战成功!29年前《宝可梦蓝》被AI通关] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

物联网卡的私人定制也有约束,这些行业标准要遵守!(物联网卡个人使用违法吗)

在卡体形态上,工业级物联网卡需通过-40℃至85℃温湿度测试、9级抗震测试,确保在极端环境下稳定运行;在通信协议上,需支持TCPIP、MQTT等物联网专用协议,兼容NB-IoT、5G RedCap等低功耗广…

物联网卡的私人定制也有约束,这些行业标准要遵守!(物联网卡个人使用违法吗)

54岁王茜华现状:为小丈夫高龄生子,身材走样,参加婚礼无人识!(王茜华?)

王茜华和丈夫沈航俩人在片场相识,俩人都是非常热爱演戏的演员。王茜华对于沈航的示好也是非常的惊讶,不清楚这般英俊的小伙子怎么会看上自己,何况俩人的年龄还相差很大。 就在这时,沈航对王茜华提出了分手,自知俩人…

54岁王茜华现状:为小丈夫高龄生子,身材走样,参加婚礼无人识!(王茜华?)

大S遗产战升级!豪宅贷款未还,珠宝失窃成谜,谁在转移财产?(遗产大作战豆瓣)

五个月过去,房子贷款、孩子监护权这些事还没解决,最近又爆出她留下的珠宝可能被人拿走了。汪小菲现在负责照顾孩子,大S妈和张兰这对婆婆媳妇关系更僵了。两边都在等对方先出错,但孩子和大S的遗产还在那搁着,没人能拿走…

大S遗产战升级!豪宅贷款未还,珠宝失窃成谜,谁在转移财产?(遗产大作战豆瓣)

助手介绍!!!!(助手是干嘛的)

🔥🔥🔥 最近挖到个超火的全能足球神器,没试过的宝子真的亏大了‼️ 这 APP 简直是足球迷的本命神器👏 ✅灵感来了自己发单💡(说不定能当预测大神呢) ✅ 自己下单超自由🛒(我的预测我说了算)…

助手介绍!!!!(助手是干嘛的)

耗费7年票房仅8000万,暴露姜文真实处境,刘宇宁的话果然验证了(票房破7亿什么概念)

讽刺的是,观众也渐渐习惯了依赖平台的评分来判断作品,而放弃了自主的评价和审美,这不仅降低了艺术欣赏能力,也使得数据反而成为了束缚观众的枷锁。 在这个过程中,制片方与剧组忙于制造噱头和刷数据,却忽视了作品本身的…

耗费7年票房仅8000万,暴露姜文真实处境,刘宇宁的话果然验证了(票房破7亿什么概念)