实探哈尔滨智算中心:AI芯片国产化率已达100%

实探哈尔滨智算中心:AI芯片国产化率已达100%

本报记者 李乔宇

哈尔滨冬日的室外温度动辄低至零下二十摄氏度,中国移动智算中心(哈尔滨)(以下简称“哈尔滨智算中心”)的展厅却温暖如春。

与其他地区的数据中心相比,哈尔滨智算中心具有独特的温度优势。“数据中心是公认的‘耗能大户’,但在哈尔滨,我们每年有157天不用空调降温,将大幅减少智算中心降温所需要的能耗。”在上述展厅里,中国移动通信集团(以下简称“中国移动”)黑龙江有限公司政企事业部经理郅刚告诉《证券日报》记者:“同时我们也对智算中心的热能有精细化的二次利用,展厅的温度以及整个园区的供暖都来自机房的免费的‘热’。”

独特的气候优势,让全球运营商最大单集群智算中心落户于此。如今,哈尔滨智算中心已经实现AI芯片100%国产化,首次通过国产网络设备探索1.8万张智算卡单集群部署规模上限,可提供6.93EFLOPS(每秒693亿亿次半精度浮点运算)智能算力,相当于300多万台高性能计算机的算力水平。

筑起“极致算力”

据介绍,哈尔滨智算中心的前身哈尔滨数据中心作为“四云合一”的数据中心,具备强大的数据处理和存储功能,承载了中国移动用户十亿量级的行程码数据;作为全国5G网络东北大区的核心节点,这里还承担着北京和河北地区的通信备份任务,在诸如冬奥会等重大活动期间,哈尔滨能够提供与北京同等级别的通信保障;哈尔滨数据中心还汇聚了包括百度在线网络技术(北京)有限公司、阿里巴巴集团控股有限公司、腾讯控股有限公司在内的120余家互联网大厂的服务器。

“同时我们还具备强大的算力输送能力。”郅刚表示,中国移动在哈尔滨建设了全国400G的OTN(光传送网)省际骨干网,能够实现地市之间1毫秒、省内5毫秒、全国20毫秒的信息传输速度,为算力“大脑”构建起高速运转的“神经”。

在哈尔滨智算中心内部,一条写着“大干两个百天 奋力书写智算领域自立自强的时代答卷”的红色横幅特别醒目。

在两个“一百天”里,中国移动完成了哈尔滨数据中心迈向哈尔滨智算中心的转型升级,完成3千多平方米高功耗机房重大调整改造,千万级精密器件复杂施工;30多个单位、千余人的协同作战,实现了提前4个月建成全球运营商最大单集群智算中心。

谈及哈尔滨智算中心,郅刚用了“极致算力、极限组网、极效存储、极速运维”几个词。“极致算力”指的是6.93EFLOPS智能算力;“极限组网”指的是采用国产46KW风冷网络设备、构建最大规模两级组网;“极效存储”指的是采用大规模融合分级存储,满足大模型训练时海量、多样数据的高效处理和高吞吐要求;“极速运维”指的是通过制度、技术和标准三大措施,实现分钟级故障定界定位和小时级模型断点续训,保障万张AI加速卡长时间稳定并行训练,为万亿模型训练提供高性能、高可用、高可靠的算力底座。

“目前,中国移动九天千亿参数模型已在集群上实现高效、长期稳定训练。”郅刚表示。

国产化程度提升

哈尔滨智算中心中红色横幅提到的“智算领域的自立自强”,既体现在万卡集群赋能国内AI产业发展上,也体现在AI芯片国产化率100%上。

“万卡集群”是由超过一万张加速卡(如GPU、TPU、NPU等专用AI芯片)组成的高性能计算系统,主要用于加速人工智能模型的训练和推理。

“我们每台机柜会安装三台全国产化算力服务器——昇腾智算服务器Atlas 800 TA2,每台服务器搭载4颗CPU芯片和8颗NPU芯片,每一颗NPU芯片提供376TFLOPS(每秒一万亿次浮点运算)算力,八颗NPU芯片一共能够提供3PFLOPS(每秒一千万亿次浮点运算)算力,哈尔滨智算中心的服务器总数为2304台,整体能够保障6930PFLOPS高效稳定的算力输出。”

值得一提的是,《证券日报》记者注意到,随着技术、性能和生态建设上持续完善,我国AI芯片已经能够实现与国际顶尖产品同台竞技。

2024年4月份,中国移动智算中心(呼和浩特)为彼时全球运营商最大单体智算中心,AI芯片国产化率超85%,智能算力规模高达6.7EFLOPS。四个月后,哈尔滨智算中心正式上线投产,AI芯片国产化率以及智能算力规模较中国移动智算中心(呼和浩特)均有增长。此外,政府为主导的城市智能计算中心多采用国产AI芯片。

谈及万卡集群智算中心国产化态势,中昊芯英(杭州)科技有限公司首席解决方案架构师平晓峰表示,目前国内国产GPU芯片厂商与NPU、TPU等芯片厂商都在积极布局万卡集群市场。

据平晓峰介绍,GPU芯片与NPU、TPU芯片各有千秋,均能充分满足万卡集群智算中心的算力需求。“GPU出现较早,最初用于图像处理,因其高并行计算能力而在大模型出现的早期阶段成了支撑模型计算的硬件选择,但其功耗和成本较高。”平晓峰表示,“像以TPU为代表的AI芯片,则是专门针对AI大模型计算框架而设计,在AI智算场景中所表现出来的计算性能、算力利用率、能效比等更有优势。”

“万卡集群智算中心的国产化趋势已经较为明显。”平晓峰表示,智能算力建设迈入万卡时代,算力需求旺盛,市场前景广阔,预计国产AI芯片的蓬勃发展与万卡集群智算中心的算力需求将实现相互成就。

特别声明:[实探哈尔滨智算中心:AI芯片国产化率已达100%] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

稳生产、提效率——自动化配料生产线的日常维护保养指南(稳生产提效率降消耗)

在现代化生产中,自动化配料生产线是保障产品质量、提升生产效率的核心环节。定期盘点:每半年核对备件库存,及时补充消耗品,避免因缺件影响生产。通过日常清洁、定期检查、精准校准、备件管理和人员培训,企业能有效降低…

稳生产、提效率——自动化配料生产线的日常维护保养指南(稳生产提效率降消耗)

率先布局AI+AR技术,雷鸟创新:口碑和销量实现双丰收

李宏伟表示,AI+AR眼镜行业目前还处于一个早期发展阶段,雷鸟创新采用“一边攀登珠穆朗玛峰,一边沿途下蛋”的发展策略,公司研发面向未来的技术,同时会把它相对更成熟一点的东西,投入到量产的状态。 雷鸟创新的主…

率先布局AI+AR技术,雷鸟创新:口碑和销量实现双丰收

陈梦新装惊艳,网友称誉有加(陈梦vis)

黄色无袖连衣裙衬托出她白藕般的玉臂,搭配黄色头发披肩,整个造型十分协调。网友们纷纷称赞:“陈梦简直是如同公主般的存在,美得令人如入梦乡,明眸皓齿,倾国倾城。” 亦有网友感叹道,陈梦在生活中如同公主般优雅,而…

陈梦新装惊艳,网友称誉有加(陈梦vis)

曾打败韦唯毛阿敏,被亲弟弟被狂扇耳光,一代歌后沦为保姆谋生(韦唯当年多厉害)

她曾是《绿叶对根的情意》的原唱,曾在歌唱比赛中力压韦唯和毛阿敏,夺得冠军。商演并没有带给她更多的事业机会,却让她收获了一段爱情。 更让她心碎的是,谷建芬曾主动邀请她学习音乐,但金炜玲错过了这个机会,拒绝了谷建…

曾打败韦唯毛阿敏,被亲弟弟被狂扇耳光,一代歌后沦为保姆谋生(韦唯当年多厉害)

6种经典稳压电路解析(简单稳压电路)

稳压电路在电子设备中起着至关重要的作用,它能够保证电源输出的电压稳定,减少电压波动对设备的影响。在一些对电压变化敏感的电路中,并联稳压电路能够及时调整,保证设备的正常运行。 答:开关稳压电路效率较高,能适应…

6种经典稳压电路解析(简单稳压电路)