国际象棋赛OpenAI o3模型碾压夺冠,马斯克的Grok决赛遭零封(国际象棋赛事一览表)

国际象棋赛OpenAI o3模型碾压夺冠,马斯克的Grok决赛遭零封(国际象棋赛事一览表)

8 月 14 日消息,在上周举行的“人工智能国际象棋表演赛”中,OpenAI 的 o3 模型以出色的表现赢得了冠军,在决赛中战胜了 xAI 的 Grok 4。此次比赛在谷歌旗下的 Kaggle 平台举办,共有八个 AI 模型参与角逐,经过三天的淘汰赛,最终决出冠亚季军。

比赛规则要求 AI 模型在未经过专门训练的情况下参赛,仅能在赛前从『互联网』上获取国际象棋相关知识。在决赛中,o3 以 4-0 的比分横扫 Grok 4,且在三场比赛中均以 4-0 的比分获胜,还在半决赛中轻松击败了同门的 o4 mini。

相比之下,Grok 4 在决赛前也展现了强大的实力,先后淘汰了谷歌的 Gemini 2.5 Flash 和 Gemini 2.5 Pro。当时,xAI 的创始人埃隆・马斯克曾表示,xAI “基本没在象棋上花功夫”。

注意到,国际象棋对弈网站 Chess.com的总编辑 Pedro Pinhata 指出,Grok 4 在半决赛前似乎无人能敌,但在最后一天的比赛中,其优势被打破。国际象棋大师中村光在直播中评论称,Grok 4 在比赛中犯了很多错误,而 OpenAI 的 o3 则表现出色。另一位解说嘉宾、国际棋联世界排名第一的芒努斯・卡尔森表示,决赛中两个 AI 的水平相当于刚学会规则的普通棋手,大约 800ELO(等级分)。他指出,这些模型在计算吃子方面表现出色,但在将死对手方面则显得不足,更像“擅长收集食材,却不会做饭”。

值得注意的是,此前在国际象棋领域,专为该棋类设计的人工智能系统表现更为出色。例如,2019 年击败韩国棋手李世石的 AlphaGo 和上世纪击败国际象棋大师加里・卡斯帕罗夫的超级电脑“深蓝”,都是为特定棋类定制的程序。今年早些时候,在国际象棋大师 Levy Rozman 举办的锦标赛中,Grok 和 ChatGPT 均输给了专为国际象棋设计的人工智能系统 Stockfish。

特别声明:[国际象棋赛OpenAI o3模型碾压夺冠,马斯克的Grok决赛遭零封(国际象棋赛事一览表)] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

韩国女星两度离婚,如今靠美容美发谋生,每天挤地铁上下班(韩国女『明星』️女二号)

"这句带着生活智慧的调侃,揭开了这位前顶流偶像的生存现状。当被问及现状时,这位昔日女神在镜头前整理着染发剂,坦然道:"所谓成功,现在就是孩子们说'妈妈做的饭最香'。 从打歌

韩国女星两度离婚,如今靠美容美发谋生,每天挤地铁上下班(韩国女『明星』️女二号)

刷新两项世界纪录 全球最大26兆瓦级海上风电机组并网发电(刷新世界记录)

从东方电气集团获悉,我国自主研制的26兆瓦级海上风电机组在山东东营成功并网发电,该机组一举刷新全球已并网风机的单机容量与叶轮直径两项纪录。此次并网发电的26兆瓦级海上风电机组,轮毂中心高度相当于50多层居民楼…

刷新两项世界纪录 全球最大26兆瓦级海上风电机组并网发电(刷新世界记录)

离开胡杏儿13年,被23岁大小姐5亿求婚,45岁『黄宗泽』终于扬眉吐气

有些人用表情包调侃他是“5亿女婿”,也有人讨论单身是否比结婚更好,甚至有评论称这场求婚更像是一出小说。 这次事件虽然只是一次娱乐八卦,但也反映了现代人对婚姻看法的变化。有人猜测那位千金的身份,甚至有人怀疑这是…

离开胡杏儿13年,被23岁大小姐5亿求婚,45岁『黄宗泽』终于扬眉吐气

明晚正式开播!又一部权谋剧来袭!看到阵容我很放心(明晚晚会直播)

该剧于10月30日晚上6点在腾讯平台上线,由『宋茜』与『丁禹兮』领衔主演,此外,付辛博、『陈乔恩』、周洁琼、曹骏等演员也参与其中,强大的阵容令观众充满期待。 值得一提的是,『宋茜』在剧中首次挑战女将军一角,楚瑜这一角色充满了…

明晚正式开播!又一部权谋剧来袭!看到阵容我很放心(明晚晚会直播)

高尔夫果岭旗杆革新:不锈钢与铝合金的碰撞(高尔夫果岭旗杆位置)

高尔夫果岭旗杆不仅是场地标识,更是运动美学的重要组成部分。本文探讨新型旗杆旗面材质及其背后的技术创新,解读其在高尔夫球场中的实际运用价值。为什么不锈钢与铝合金成为行业新宠?它们如何协同提升赛事表现和用户体验?

高尔夫果岭旗杆革新:不锈钢与铝合金的碰撞(高尔夫果岭旗杆位置)