马斯克尴尬了,20万显卡堆的Grok3,1天就被Deepseek打败了?

前两天,马斯克旗下的AI公司xAI,发布了其最新的AI大模型,也就是Grok3,以发布会上,马斯克称其是全球最聪明的AI。

而从各种测试对比来看,Grok3,也确实很厉害,比OpenAI、Deepseek的得分更高。

而Grok3,马斯克是主打一个大力出奇迹,那就是堆了20万张H100显卡,堪称是全球算力最强的大模型。

今日霍州(www.jrhz.info)©️

马斯克的Grok3推出,似乎也证明了,规模定律(Scaling Law)仍然有效,堆算力依然是AI大模型的必由之路。

不过,让马斯克尴尬的事出现了,堆了20万显卡的Grok3,仅1天,Deepseek就又搞出新东西了,那就是NSA。

『DeepSeek』在『社交平台』X上发布了一篇关于NSA的纯技术论文报告。

今日霍州(www.jrhz.info)©️

按照Deepseek的说法,NSA是一种与硬件高度适配并可原生训练的稀疏注意力机制,实现超高速长上下文训练与推理。

NSA和『DeepSeek』的一惯风格相似,那就是低成本高效,通过对现代硬件的优化设计,NSA可以降低预训练的成本,且不牺牲性能,且NSA的表现可可媲美甚至超越全注意力模型。

也就是说,完全不需要像Grok3这样,堆20万张显卡,NSA依然可以采用低成本的方式,实现对其它AI模型的超越。

今日霍州(www.jrhz.info)©️

可见,目前在AI上,Deepseek主打一个四两拨千斤,而Grok、Openai们,则主打大力出奇迹,努力的堆显卡。

本来美国那边的AI公司认为,限制中国的AI卡,不让你们获得先进的AI『芯片』,那么就肯定打不过我们的AI模型,不曾想,中国的AI模型,不需要堆显卡,也能实现更强的性能,更好的体验,这就真的让美国的这些企业们懵圈了,更重要的是,这也打破了美国的所谓算力垄断,整个AI『芯片』格局,都可能重构。

特别声明:[马斯克尴尬了,20万显卡堆的Grok3,1天就被Deepseek打败了?] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

75岁再扮14岁少女版武则天,『刘晓庆』敢演,我们就敢看,人生嘛一场戏,咬紧牙关看呗

时光流转,毛戈平已经从化妆师成长为上市公司的老板,而『刘晓庆』早已在影坛中树立起多个经典角色,尤其是她的武则天,几乎成了她的代表作。她的生活经历厚重而广阔,即便到了六七十岁的年纪,身边依旧是比她年轻很多的男…

75岁再扮14岁少女版武则天,『刘晓庆』敢演,我们就敢看,人生嘛一场戏,咬紧牙关看呗

凝智聚力促发展 服务前沿赋新能——沈阳市知识产权保护中心召开技术与创新支持中心座谈会(凝心聚力促发展)

1月21日,沈阳市知识产权保护中心召开以“汇聚智慧力量,赋能创新发展”为主题的技术与创新支持中心(TISC)座谈会,部署2026年重点工作,一体化推进TISC及服务站建设。 沈阳保护中心将统筹TISC及服务…

凝智聚力促发展 服务前沿赋新能——沈阳市知识产权保护中心召开技术与创新支持中心座谈会(凝心聚力促发展)

为什么要做GEO搜索优化,慧多派营销策划GEO搜索优化:解锁本地商家精确获客的流量密码(为什么要做核检)

在流量从“全域撒网”转向“本地精耕”的时代,不做GEO优化,就意味着商家将被算法隐藏,错失3-5公里内的核心客群;而做好GEO搜索优化,就能让商家在用户决策瞬间精准曝光,实现从“被找到”到“被选择”的高效转化…

为什么要做GEO搜索优化,慧多派营销策划GEO搜索优化:解锁本地商家精确获客的流量密码(为什么要做核检)

一审被判20个月,金建希死里逃生!尹锡悦遭抛弃,李在明区别对待(一审判决几个月)

韩国前第一夫人金建希,曾被检方要求判处15年刑期,然而在一审判决中,她仅被判处了20个月的有期徒刑。这一判决是与金建希相关的三起案件中的第一场判决,虽然这一判决意味着金建希的刑期肯定不会只有20个月,但这也反…

一审被判20个月,金建希死里逃生!尹锡悦遭抛弃,李在明区别对待(一审判决几个月)

甘比戴帝王紫翡翠很富贵,『朱茵』穿红裙喜庆,翡月荟老板娘更贵气!(甘比戴帝王紫宝石亮相晚宴)

再瞄一眼她身边吕爱琼脖子那串绿得发黑的帝王绿,瞬间明白:这根本不是拼颜值,是拼谁能把“身价”戴得不动声色。有人猜她是不是炒股亏了,我倒觉得这才是真会——把“我不用logo也能让你知道我是谁”写在脸上。戴对了,…

甘比戴帝王紫翡翠很富贵,『朱茵』穿红裙喜庆,翡月荟老板娘更贵气!(甘比戴帝王紫宝石亮相晚宴)