烧钱吞电巨兽,马斯克20万块GPU烧出史上能耗最高大模型

【烧钱吞电巨兽,#马斯克20万块GPU烧出史上能耗最高大模型#】

20万块GPU“烧出”的Grok 3到底是不是地表最强AI?对此不乏争议。但毋庸置疑的是,Grok 3绝对是有史以来能耗最高的大模型。马斯克在直播中首次透露,Grok 3的训练量是Grok 2的10倍,基于人工智能初创公司xAI位于孟菲斯的超级计算机集群进行。该集群建造的第一阶段,xAI在122天内建成了拥有10万块NVIDIA H100 GPU的超级计算集群,第二阶段拓展到20万块GPU集群,仅耗时92天。有人计算了xAI在孟菲斯GPU的成本,仅以10万块H100、每块GPU费用30000美元💵计算,Grok 3的总硬件消耗就已超出30亿美元💵。

能耗方面,H100的典型功耗约为700瓦,以此计算,Grok 3使用的GPU总能耗相当于一个小城市的用电量。假设电力来源为混合能源(平均碳排放系数0.5千克二氧化碳/千瓦时),Grok 3训练产生的碳排放大致相当于4万多辆燃油车一年的碳排放量。

马斯克与xAI团队在Grok 3直播演示中称,20万块GPU需要功率多达250MW的电力。“(面对电力缺口)我们最初租赁了一大堆发电机……又租用了美国四分之一的制冷能力……从来没有人建造过如此大规模的液冷『数据中心』。”他们同时预告,xAI已在着手研究下一个更强大的算力集群,所需电力高达1.2GW。(澎湃新闻)

今日霍州(www.jrhz.info)©️

特别声明:[烧钱吞电巨兽,马斯克20万块GPU烧出史上能耗最高大模型] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

日票房仅406万,离开了『王传君』,他却失去了票房号召力(日票房最高)

回首这一年,电影市场虽然热闹非凡,但真正能在口碑和票房上双丰收的作品,除了动画电影《哪吒2》,也就只有申奥执导的《南京照相馆》了。尽管肖央的演技相当扎实,但同类角色的过度重复,让他的表现失去了新鲜感,也让观众…

日票房仅406万,离开了『王传君』,他却失去了票房号召力(日票房最高)

『巩俐』也没想到,那个她恋了8年没得到的男人,又破了电影圈的神话(『巩俐』 没有)

若是『张艺谋』知道,『巩俐』在与他分手后又结了两次婚,并且移居国外,最终与一个外国人走到了一起,一生未曾生育孩子……他会后悔吗?或许,『巩俐』也在心中暗自期待,『张艺谋』的这部作品会让她再次感受到那个曾经让她动心的男人的光芒…

『巩俐』也没想到,那个她恋了8年没得到的男人,又破了电影圈的神话(『巩俐』 没有)

广州博澳斯电器申请节能型冷柜及智能分区自适应控制方法专利,提升制冷柜制冷系统的控制效率(广州博澳斯电器泰国项目)

国家知识产权局信息显示,广州博澳斯电器有限公司申请一项名为“一种节能型冷柜及智能分区自适应控制方法”的专利,公开号CN121383565A,申请日期为2025年12月。通过天眼查大数据分析,广州博澳斯电器有限…

广州博澳斯电器申请节能型冷柜及智能分区自适应控制方法专利,提升制冷柜制冷系统的控制效率(广州博澳斯电器泰国项目)

分布式光纤振动预警系统:从信号感知到数据智能的工程演进(分布式光纤振动监测技术)

Φ-OTDR核心阵列:实现高灵敏度(可检测纳米级应变)与空间分辨率(达1-3米),但受限于双程衰减,监测距离通常为40-80公里 DAS技术延伸:分布式声学传感通过分析背向瑞利散射光的强度变化,更适用于低…

分布式光纤振动预警系统:从信号感知到数据智能的工程演进(分布式光纤振动监测技术)

专访敦淇:拒绝套路化,《秋雪漫过的冬天》如何靠“真”出圈?(简单好玩的手工玩具步骤)

当剧集的余温转化为观众口口相传的诚意推荐,当故事内核所引发的、关于成年人情感困境与精神救赎的深切探讨,开始在更广阔的公共空间里缓慢沉淀与扩散,或许,才是它作为一次成功的现实主义创作,其社会价值与行业启示的真…

专访敦淇:拒绝套路化,《<strong>秋雪漫过的冬天</strong>》如何靠“真”出圈?(简单好玩的手工玩具步骤)