马斯克野心勃勃,但Grok3翻车了,回答9.11比9.9大……

马斯克野心勃勃,但Grok3翻车了,回答9.11比9.9大……

在人工智能领域的激烈竞争中,科技巨头马斯克再次引发轰动。近日,他与xAI团队在一场备受瞩目的直播中正式发布了最新版本Grok-3,并宣称这是"地球上最聪明的AI"。然而,这一雄心勃勃的宣言很快遭遇了现实的考验。

马斯克声称Grok-3在数学、科学和编程的基准测试中已经超越了所有主流模型。这一说法似乎得到了一定的支持,因为AI确实在处理复杂数学问题时展现出了令人惊叹的能力。然而,当面对看似简单的常识性问题时,AI却暴露出了令人意外的弱点。

最具代表性的是"9.11与9.9哪个大"这个问题。这个看似简单的比较,却成为了检验AI常识判断能力的试金石。令人意外的是,包括Grok-3在内的多个主流AI模型都在这个问题上栽了跟头。这一现象引发了人们对AI真实智能水平的质疑:为什么能解决复杂数学题的AI,却无法正确比较两个简单的数字大小?

尽管遭遇挫折,马斯克对Grok-3的未来仍然充满信心。他预测,Grok-3将在未来三年内实现"诺贝尔奖级别的突破",甚至可能用于SpaceX的火星任务计算。这种自信并非空穴来风,背后有着强大的技术支撑。

马斯克透露,Grok-3的训练使用了远超此前版本的算力和大量合成数据。特别值得一提的是,xAI自建的Colossus超级计算机为Grok-3提供了强大的计算能力,这台由10万个英伟达H100 GPU驱动的超级计算机,提供了2亿个GPU小时的计算能力,比Grok-2使用的算力多了十多倍。

马斯克表示,这种强大的计算能力使Grok-3能够更好地减少AI幻觉,通过检查数据并实现逻辑一致性来优化表现。然而,"9.11与9.9"问题的失误似乎暗示,单纯依靠计算力的提升可能并不足以解决AI在常识推理方面的根本问题。

尽管Grok-3在某些方面表现出色,但其在常识性判断上的失误无疑给马斯克和xAI团队敲响了警钟。

特别声明:[马斯克野心勃勃,但Grok3翻车了,回答9.11比9.9大……] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

应对降雨 北京261条公交线停驶或甩站 山区景区停车场关闭:防汛一级响应启动(北京降暴雨)

8月4日13时,北京市升级发布全市暴雨红色预警信号,全市启动防汛一级应急响应。面对严峻的天气形势,市交通部门依据应急响应要求落实各项措施,道路方面遇积水超27厘米或地质灾害立即封闭管控

应对降雨 北京261条公交线停驶或甩站 山区景区停车场关闭:防汛一级响应启动(北京降暴雨)

第十五期 | 控制系统、压变、调节阀...仪表理论总卡壳?刷就对了!(控制121)

A、容器上、下两点的压力差和容器截面 D、副调节器的输出去操纵调节阀4、在热电偶测温回路中,只要显示仪表和连接导线两端温度相同,热电偶总电动势值不会因它们的接入而改变,这是根据中间导体定律而得出的结论。 …

第十五期 | 控制系统、压变、调节阀...仪表理论总卡壳?刷就对了!(控制121)

如今靠70岁任达华再度翻红,曾是谢霆锋舅舅初恋,搭档刘德华没火(任达荣退休)

到1986年,她与导演潘源良的绯闻又一次让媒体沸腾,这段关系最终也以分手告终,李丽珍的爱情之路充满了坎坷与反复。她参演的《爱的精灵》和《蜜桃成熟时》让她在香港娱乐圈一度名声大噪,票房和片酬均创造了不小的纪录,…

如今靠70岁任达华再度翻红,曾是谢霆锋舅舅初恋,搭档刘德华没火(任达荣退休)

《利剑玫瑰》直到真正的林然被找到,才知,为何章阿姨、邓妍崩溃(《利剑玫瑰》电视剧)

而这个“林然”当然不是真正的林然,她只是长得像林然而已,章阿姨没想到世上有这么巧合的事情,对于林然的长相,之前邓妍就通过模拟得到了她长大之后的画像,章阿姨自然对此十分的关注,居然和自己的店员一起吧这个“林然…

《利剑玫瑰》直到真正的林然被找到,才知,为何章阿姨、邓妍崩溃(《利剑玫瑰》电视剧)

赵露思直播带火成都面馆,半天销量翻三倍食材售罄!泼天富贵来了(赵露思在哪个平台直播)

2025年8月3日,赵露思在解约风波中轻描淡写的一句“实在不行开个小面馆”,不仅让3000万观众心头一颤,更让这家日均30单的社区小店,次日半天卖出80碗,豌豆杂酱紧急告罄,粉丝排队两小时只为打卡同款豌杂面。…

赵露思直播带火成都面馆,半天销量翻三倍食材售罄!泼天富贵来了(赵露思在哪个平台直播)