马斯克野心勃勃,但Grok3翻车了,回答9.11比9.9大……

人工智能领域的激烈竞争中,科技巨头马斯克再次引发轰动。近日,他与xAI团队在一场备受瞩目的直播中正式发布了最新版本Grok-3,并宣称这是"地球上最聪明的AI"。然而,这一雄心勃勃的宣言很快遭遇了现实的考验。

马斯克声称Grok-3在数学、科学和编程的基准测试中已经超越了所有主流模型。这一说法似乎得到了一定的支持,因为AI确实在处理复杂数学问题时展现出了令人惊叹的能力。然而,当面对看似简单的常识性问题时,AI却暴露出了令人意外的弱点。

最具代表性的是"9.11与9.9哪个大"这个问题。这个看似简单的比较,却成为了检验AI常识判断能力的试金石。令人意外的是,包括Grok-3在内的多个主流AI模型都在这个问题上栽了跟头。这一现象引发了人们对AI真实智能水平的质疑:为什么能解决复杂数学题的AI,却无法正确比较两个简单的数字大小?

尽管遭遇挫折,马斯克对Grok-3的未来仍然充满信心。他预测,Grok-3将在未来三年内实现"诺贝尔奖级别的突破",甚至可能用于SpaceX的火星任务计算。这种自信并非空穴来风,背后有着强大的技术支撑。

马斯克透露,Grok-3的训练使用了远超此前版本的算力和大量合成数据。特别值得一提的是,xAI自建的Colossus超级计算机为Grok-3提供了强大的计算能力,这台由10万个『英伟达』H100 GPU驱动的超级计算机,提供了2亿个GPU小时的计算能力,比Grok-2使用的算力多了十多倍。

马斯克表示,这种强大的计算能力使Grok-3能够更好地减少AI幻觉,通过检查数据并实现逻辑一致性来优化表现。然而,"9.11与9.9"问题的失误似乎暗示,单纯依靠计算力的提升可能并不足以解决AI在常识推理方面的根本问题。

尽管Grok-3在某些方面表现出色,但其在常识性判断上的失误无疑给马斯克和xAI团队敲响了警钟。

特别声明:[马斯克野心勃勃,但Grok3翻车了,回答9.11比9.9大……] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

43岁日本名模富永爱宣布怀孕!九头身比例+硬朗的骨相,又美又飒(日本国际上最出名模特)

12月20日,43岁的富永爱在Instagram上一条动态让热搜瞬间爆炸,她宣布自己怀孕了,而孩子的父亲是39岁的演员山本一贤。富永爱在声明中写道:尽管有困惑和不安,但这是第一次有人让我觉得,我可以先做富永爱…

43岁日本名模富永爱宣布怀孕!九头身比例+硬朗的骨相,又美又飒(日本国际上最出名模特)

原来她已去世11年……本以为转行退圈,没想到是电视剧拍一半遭遇车祸离世(原来是她小说免费阅读)

11年过去了,《蓝狐》的旋律依然回荡在耳边,但那个鲜活的刘丹却永远停留在了最美好的年华。 然而,真正让她被大众所熟知的,是她在《蓝狐》里饰演的刘丹。她曾请护士帮忙发了一条微博,字里行间满是她对表演的渴望与…

原来她已去世11年……本以为转行退圈,没想到是电视剧拍一半遭遇车祸离世(原来是她小说免费阅读)

思朗万维申请基于HPC集群的Slurm资源调度优化方法专利,提高了调度效率和资源利用率(朗思威招聘)

国家知识产权局信息显示,湖北思朗万维计算装备制造有限公司申请一项名为“基于HPC集群的Slurm资源调度优化方法及介质”的专利,公开号CN121233262A,申请日期为2025年9月。 声明:市场有风险,投…

思朗万维申请基于HPC集群的Slurm资源调度优化方法专利,提高了调度效率和资源利用率(朗思威招聘)

建盏窑变百花将军杯子:高端陶瓷茶具如何选?解读2025新趋势(建盏百花第一人)

高端建盏茶杯作为2025年的热门茶具选择,如何在众多产品中挑选适合自己的款式?本文详解建盏的特点、选购要点以及窑变工艺的魅力。带你了解建盏背后的匠心精神和高端品质,助你轻松选到心仪的茶杯。

建盏窑变百花将军杯子:高端陶瓷茶具如何选?解读2025新趋势(建盏百花第一人)

她是富商漂亮女儿,嫁豪门生1子3女,凭这手段让夫家财富暴增(她本是富豪太太)

这个在香港商界被尊称为利孝和女士的陆雁群,到底是如何做到的?她不仅在铜锣湾掌控着半个区的商业地产,每年光是租金收入就有20多亿,而且她坚持只租不售的原则,这在香港寸土寸金的地产市场里非常罕见。到了2009年,…

她是富商漂亮女儿,嫁豪门生1子3女,凭这手段让夫家财富暴增(她本是富豪太太)