实探哈尔滨智算中心:AI『芯片』国产化率已达100%

本报记者 李乔宇

哈尔滨冬日的室外温度动辄低至零下二十摄氏度,中国移动智算中心(哈尔滨)(以下简称“哈尔滨智算中心”)的展厅却温暖如春。

与其他地区的『数据中心』相比,哈尔滨智算中心具有独特的温度优势。“『数据中心』是公认的‘耗能大户’,但在哈尔滨,我们每年有157天不用空调降温,将大幅减少智算中心降温所需要的能耗。”在上述展厅里,中国移动通信集团(以下简称“中国移动”)黑龙江有限公司政企事业部经理郅刚告诉《证券日报》记者:“同时我们也对智算中心的热能有精细化的二次利用,展厅的温度以及整个园区的供暖都来自机房的免费的‘热’。”

独特的气候优势,让全球运营商最大单集群智算中心落户于此。如今,哈尔滨智算中心已经实现AI『芯片』100%国产化,首次通过国产网络设备探索1.8万张智算卡单集群部署规模上限,可提供6.93EFLOPS(每秒693亿亿次半精度浮点运算)智能算力,相当于300多万台高性能计算机的算力水平。

筑起“极致算力”

据介绍,哈尔滨智算中心的前身哈尔滨『数据中心』作为“四云合一”的『数据中心』,具备强大的数据处理和存储功能,承载了中国移动用户十亿量级的行程码数据;作为全国5G网络东北大区的核心节点,这里还承担着北京和河北地区的通信备份任务,在诸如冬奥会等重大活动期间,哈尔滨能够提供与北京同等级别的通信保障;哈尔滨『数据中心』还汇聚了包括百度在线网络技术(北京)有限公司、阿里巴巴集团控股有限公司、腾讯控股有限公司在内的120余家『互联网』大厂的『服务器』。

“同时我们还具备强大的算力输送能力。”郅刚表示,中国移动在哈尔滨建设了全国400G的OTN(光传送网)省际骨干网,能够实现地市之间1毫秒、省内5毫秒、全国20毫秒的信息传输速度,为算力“大脑”构建起高速运转的“神经”。

在哈尔滨智算中心内部,一条写着“大干两个百天 奋力书写智算领域自立自强的时代答卷”的红色横幅特别醒目。

在两个“一百天”里,中国移动完成了哈尔滨『数据中心』迈向哈尔滨智算中心的转型升级,完成3千多平方米高功耗机房重大调整改造,千万级精密器件复杂施工;30多个单位、千余人的协同作战,实现了提前4个月建成全球运营商最大单集群智算中心。

谈及哈尔滨智算中心,郅刚用了“极致算力、极限组网、极效存储、极速运维”几个词。“极致算力”指的是6.93EFLOPS智能算力;“极限组网”指的是采用国产46KW风冷网络设备、构建最大规模两级组网;“极效存储”指的是采用大规模融合分级存储,满足大模型训练时海量、多样数据的高效处理和高吞吐要求;“极速运维”指的是通过制度、技术和标准三大措施,实现分钟级故障定界定位和小时级模型断点续训,保障万张AI加速卡长时间稳定并行训练,为万亿模型训练提供高性能、高可用、高可靠的算力底座。

“目前,中国移动九天千亿参数模型已在集群上实现高效、长期稳定训练。”郅刚表示。

国产化程度提升

哈尔滨智算中心中红色横幅提到的“智算领域的自立自强”,既体现在万卡集群赋能国内AI产业发展上,也体现在AI『芯片』国产化率100%上。

“万卡集群”是由超过一万张加速卡(如GPU、TPU、NPU等专用AI『芯片』)组成的高性能计算系统,主要用于加速人工智能模型的训练和推理。

“我们每台机柜会安装三台全国产化算力『服务器』——昇腾智算『服务器』Atlas 800 TA2,每台『服务器』搭载4颗CPU『芯片』和8颗NPU『芯片』,每一颗NPU『芯片』提供376TFLOPS(每秒一万亿次浮点运算)算力,八颗NPU『芯片』一共能够提供3PFLOPS(每秒一千万亿次浮点运算)算力,哈尔滨智算中心的『服务器』总数为2304台,整体能够保障6930PFLOPS高效稳定的算力输出。”

值得一提的是,《证券日报》记者注意到,随着技术、性能和生态建设上持续完善,我国AI『芯片』已经能够实现与国际顶尖产品同台竞技。

2024年4月份,中国移动智算中心(呼和浩特)为彼时全球运营商最大单体智算中心,AI『芯片』国产化率超85%,智能算力规模高达6.7EFLOPS。四个月后,哈尔滨智算中心正式上线投产,AI『芯片』国产化率以及智能算力规模较中国移动智算中心(呼和浩特)均有增长。此外,政府为主导的城市智能计算中心多采用国产AI『芯片』。

谈及万卡集群智算中心国产化态势,中昊芯英(杭州)科技有限公司首席解决方案架构师平晓峰表示,目前国内国产GPU『芯片』厂商与NPU、TPU等『芯片』厂商都在积极布局万卡集群市场。

据平晓峰介绍,GPU『芯片』与NPU、TPU『芯片』各有千秋,均能充分满足万卡集群智算中心的算力需求。“GPU出现较早,最初用于图像处理,因其高并行计算能力而在大模型出现的早期阶段成了支撑模型计算的硬件选择,但其功耗和成本较高。”平晓峰表示,“像以TPU为代表的AI『芯片』,则是专门针对AI大模型计算框架而设计,在AI智算场景中所表现出来的计算性能、算力利用率、能效比等更有优势。”

“万卡集群智算中心的国产化趋势已经较为明显。”平晓峰表示,智能算力建设迈入万卡时代,算力需求旺盛,市场前景广阔,预计国产AI『芯片』的蓬勃发展与万卡集群智算中心的算力需求将实现相互成就。

特别声明:[实探哈尔滨智算中心:AI『芯片』国产化率已达100%] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

Agilent安捷伦34420A万用表(agilent安捷伦中国官网)

Agilent34420A纳伏表微欧表是执行低电平测量的高灵敏度万用表。它将低噪声电压测量与电阻和温度测量功能集于一身,建立了低电平测量灵活性和性能的新标准。产品特色 33420A拥有7.5位模数转…

Agilent安捷伦34420A万用表(agilent安捷伦中国官网)

风与潮》首播收视破2!剧情紧凑但『任嘉伦』表现差,聂远女儿获赞(风与潮首播口碑)

女主乔音婉(蓝盈莹饰)作为青年小提琴家,将与何贤成为志同道合的抗战知己,关系止于纯洁战友情,这份“专心搞事业”的纯粹,在当前剧集环境中显得尤为可贵。它将冷门的“金融抗战”拍得既专业又引人入胜,更在潜移默化中引…

《<strong>风与潮</strong>》首播收视破2!剧情紧凑但『任嘉伦』表现差,聂远女儿获赞(风与潮首播口碑)

国民初恋倪萍,怎么就成了犀利老奶?(国民初恋是谁女的)

早在2017年,脱口秀节目尚未火热时,倪萍便参与了《脱口秀大会》,当时她自嘲自己是百岁老人,倪萍奶奶,这句话正是回应当时网络上对于她年龄和外貌变化的调侃。倪萍还不止一次地在节目中展现了她的幽默与锐气,例如在节…

国民初恋倪萍,怎么就成了犀利老奶?(国民初恋是谁女的)

狂飙的算力基建,如何实现「价值闭环」?丨GAIR 2025

某院所不到一千万预算的项目,初期供应商推荐十几台4090,但PCIE协议不适合大模型训练,后来又推荐H200方案,而我参与项目后结合客户“科研类后训练及先进验证”的核心需求,推荐了B200,理由有三:一是B…

狂飙的算力基建,如何实现「价值闭环」?丨GAIR 2025

824Whkg的固态电池,先用于人形『机器人』️和低空飞行器(4680固态电池)

卫蓝『新能源』董事长俞会根透露,其实验室中固态电池的能量密度已达到824瓦时公斤,远期有望突破1000Whkg。人形『机器人』️:对安全性、能量密度和体积要求极高,成为理想首发场景; 这标志着,固态电池技术正从实…

824Whkg的固态电池,先用于人形『机器人』️和低空飞行器(4680固态电池)