不停机改造!塔能插拔式液冷背板实现算力中心“无感升级”
一、改造痛点:业务中断与漫长周期的双重桎梏
随着算力需求急剧增加以及双碳政策的收紧,存量算力中心遭遇了一种两难的困境,即要进行改变但又不敢停止运行。
• 业务中断损失不可承受:传统的液冷改造需要进行大规模的停机施工,这其中包括拆卸『服务器』、重新构建管路以及调试系统等一系列操作,仅仅停机一天,对于拥有千机架算力的中心而言,直接经济损失就可能达到240万至1200万元,而对于金融交易、AI训练、政务服务等核心业务来说,停机带来的影响更为严重,它意味着收入的流失,还说不定引发合规风险以及客户信任危机。
• 改造周期漫长拖累收益:从方案设计开始,历经硬件定制,再到现场施工以及调试交付,整个过程需要6至12个月,如此漫长的周期拖累了收益,节能收益与政策补贴因改造周期漫长而迟迟不能兑现,并且机房会长期处于高PUE、低算力的运营风险环境之中。
• 老旧机房适配难度大:大多数存量机房建设时间较为久远,机柜的规格存在不统一的情况,空间也比较狭窄,电力布局是固定的,传统的液冷方案如果要实施,就需要对机房结构进行大规模改动,这样一来施工难度很高,而且成本失控的风险也比较大,甚至有部分老旧机房由于条件受到限制,根本无法开展改造工作。
• 算力扩容与节能改造矛盾:企业一方面希望借助液冷改造来提升算力密度,将其从原本的10kW提升至20kW以上,另一方面又担心改造过程会对现有的业务运行产生影响,而传统方案很难在“扩容需求”以及“业务连续性”之间实现平衡。
在这样的背景状况之下,塔能科技推出了插拔式液冷背板解决方案,该方案有“不停机安装、模块化设计以及2至3个月可快速部署”这些核心优势,实现了机房的“无感升级”目的,解决了存量算力中心改造所面临的痛点问题。
二、核心创新:插拔式液冷背板,定义改造新范式
塔能插拔式液冷背板有革命性突破,这一突破体现在其从安装逻辑以及产品设计方面,对传统改造模式进行了彻底颠覆,使得“边运行、边改造”这一设想得以成为现实情况。
1. 插拔式设计:业务零中断的核心保障
• 在线安装,无需停机:液冷背板所采用的是“机柜嵌入式加上快插接口”这样的设计方式,在开展安装工作期间,并不需要把『服务器』的电源关闭,负责运维的人员可借助机柜的侧面或者后部来实施操作,先将背板与『服务器』的散热面准确地贴合在一起,然后再借助快插接头来连接液冷管路。
• 单柜改造时间仅需 1-2 小时;在改造的整个过程当中『服务器』始终保持持续运行的状态,业务没有出现任何中断的情况,达成了“无感升级”的效果。
• 免拆核心设备,风险可控:不需要对『服务器』的CPU、GPU以及主板等核心部件进行拆卸,这样可防止出现硬件损坏以及保修失效的风险,其背板运用弹性导热接口,可兼容市场上主流的『服务器』品牌以及规格。
• 不需要进行定制化改造,其适配性可达到99%以上,如此一来可以大幅度降低兼容性方面的风险。
• 双系统冗余兜底:在改造期间可支持液冷系统和原有的风冷系统同时并行运转,智控平台会对运行状态进行实时监测,一旦遇到突发状况可以迅速切换到风冷模式,以此来保障业务的连续性,完全消除企业对于“改造期间算力中断”的担心。
2. 模块化架构:快速部署与灵活适配的基础
• 三大模块化单元:也就是把液冷系统划分成了插拔式背板模块、分布式冷源模块以及物联网智控模块这三个部分,各个模块都是按照标准化的方式来进行生产的,并且在出厂之前还会进行预调试,这样一来,在现场的时候只需要进行拼接组装就行,根本不需要进行复杂的施工操作。
• 全规格机柜适配:背板模块可支持 600mm、800mm以及1000mm等多种主流机柜宽度,其厚度仅仅只有100mm,采用嵌入式安装方式不会占用机房的核心空间,对于老旧机房狭窄空间场景可以实现完美适配。
• 算力密度弹性升级:可支持从10kW至50kW/机柜的算力密度提升,企业可依据自身业务需求,先将其升级到20kW的基础高密度状态,后续凭借增添背板导热模块以及升级智控算法,便可扩容至50kW,而无需进行二次大规模改造,这样一来扩容成本降低了80%。
3. 航天级工艺:可靠性与安全性双保障
• 军工级密封设计:借鉴了航天装备的密封工艺,背板和管路接口运用双重密封结构,使得漏液率几乎接近于零,管路选用航天级耐腐蚀材料,压力测试标准是行业标准的两倍,可承受长期运行压力。
• 环保安全工质:选用航天级环保冷却液,无毒、无味、不可燃,
• 该物质化学性质较为稳定,其使用寿命可超过10年,在这10年期间不会对『服务器』设备产生腐蚀现象。
• 航天级故障预警:系统集成了高精度温度传感器以及压力传感器,可对背板的运行状态展开实时监测,其智控平台可以提前72小时识别出如接口松动、流量异常等潜在异常情况,并且会自动触发预警以及应急处理机制,该系统的平均无故障运行时间超过了10万小时。
三、改造流程:2-3 个月极速落地,全程 “无感”
塔能插拔式液冷背板依靠标准化流程以及模块化设计,可把改造周期缩短到2至3个月,在整个过程中都不会对业务运行造成影响。
阶段
时间周期
核心工作
关键优势
调研设计期
1-2 周
利用激光三维扫描技术对机房进行扫描,以此来采集机柜、『服务器』以及电力数据,然后结合算力需求和PUE目标,输出定制化的改造方案,最后依靠仿真模拟来呈现改造后的热分布以及运行状态。
无需现场反复测绘,方案精准度高,避免后期调整
工厂预制期
4-6 周
按照定方案来生产插拔式背板、冷源模块以及管路接头,针对全系统展开预调试工作,以此保证各个模块之间有良好的兼容性以及运行的稳定性,同时还要为智控平台的算法训练提供相应配套支持。
工厂标准化生产,质量可控;预调试减少现场施工时间
现场部署期
2-4 周
分布式冷源模块凭借特定方式完成吊装并使其处于就位状态,接着逐个机柜进行背板的插拔操作来完成安装,同时利用快插接口实现管路的连接,最后将智控模块与现有的机房系统进行对接工作。
采用并行施工的方式,每天可完成30至50个机柜的改造工作,施工过程中不存在动火情况,也没有大规模的重构作业,不会对机房的正常运维造成影响。
调试优化期
1 周
分区域启动液冷系统,使其与风冷系统共同运行,对智控平台的参数进行细微调整,以此来优化冷量分配,持续监测PUE、温度以及业务运行状态。
实现平滑切换,期间不会出现业务波动情况,AI算法可自动适配负载,快速达成目标PUE。
改造核心亮点:
• 施工干扰极小:在现场进行施工时,所需施工团队人数仅为2至3人,并且施工过程中运用的是静音工具,施工所产生的噪音可控制在低于60分贝的水平,粉尘污染几乎接近于零,这也就意味着完全不会对机房现有的运维工作造成任何影响。
• 业务零感知:改造工作按照机柜列依次分批推进,在每一列进行改造的时间段内,与之相邻的机柜可保持正常运行状态,在此期间,业务流量不会出现任何波动情况,无论是用户还是员工,都全然无法察觉到改造工作正在开展。
• 快速兑现收益:在高密度算力场景中可快速实现收益兑现,像单机柜功率≥10kW这种情况,借助液冷以及精准管控技术,可把PUE从1.5以上降低到1.25以下,在部分理想条件下甚至可以挑战1.15,以一个拥有千机架的『数据中心』来测算,一年节省的电费可达到千万级别,比如在东部地区电价的情况下,可以达到1500万元以上。依靠将重点放在关键能耗系统的改造上,典型的投资回报周期可控制在3至5年,相比部分粗放型改造方案缩短超过50%,能加快收益兑现。
四、场景价值:适配存量改造与算力扩容双重需求
塔能插拔式液冷背板可很好地适配存量机房改造、算力扩容以及合规整改等核心场景,成为企业液冷转型时的首选方案。
1. 老旧机房节能改造
• 痛点:空间狭窄、机柜规格不统一、无法停机;
• 价值:在于模块化可适配老旧机房环境,不需要对机房结构进行改动,可以在不停机的情况下开展施工,避免业务遭受损失,改造之后 PUE 可达到标准。
• 可申报节能补贴,千机架机房补贴金额可达数百万元。
2. 算力密度扩容升级
• 痛点:现有的风冷方式无法对20kW及以上的高密度算力提供支撑,若要进行扩容则需要对冷却系统加以改造。
• 价值:可支持10至50kW算力密度实现弹性升级,经过改造之后单机柜的算力会成倍增长,甚至可以达到原来的5倍,不需要额外增加机房空间,土地以及土建成本可降低30%,可以适配AI、云计算等高密度算力需求。
3. 政策合规紧急整改
• 痛点:PUE 超标面临限电、处罚,需快速完成改造;
• 价值:可在两到三个月的时间内迅速实现落地,快速达成 PUE 小于或等于 1.2 的合规标准要求,改造过程不会对业务造成影响,可避免因整改而致使的客户流失以及收入损失情况发生。
4. 核心业务机房改造
• 痛点:金融、政务以及医疗等核心业务,一旦出现停机情况,将会造成巨大的损失,并且对于改造的安全性有着极高的要求。
• 价值:体现于业务零中断改造方面,采用双系统冗余进行兜底保障,有航天级可靠性设计,可使风险处于可控状态,拥有智控平台可对全程给予监控,让改造过程实现可追溯以及可管控。
五、智能赋能:改造与运维的双重优化
塔能插拔式液冷背板深入贯彻“软件定义硬件”理念,配备物联网智控平台,达成改造后运维效率以及节能效果的双重提高:
• AI 精准节能:依据算力负载以及环境温度数据,AI算法可动态调节背板冷却液流量与冷源输出,防止出现“过度制冷”造成的浪费现象,相比传统液冷方式可节能15%至20%,与“好节能,塔能物联网精准节能”这一价值主张高度契合。
• 远程智能运维:可对电脑端以及移动端进行支持,实现远程监控背板的运行状态,其中包括温度、流量以及压力等方面,同时还有故障预警以及远程调试的功能,对于千机架机房而言,仅仅需要两到三人便可完成日常的运维工作,人力成本降低了百分之七十,达成了“让物联运维更具便捷性以及节能性”的目标。
• 能耗量化追溯:智控平台可自动生成按照小时、日期以及月份的能耗报告,清楚地呈现出改造前后PUE的对比情况、电费节省的具体金额以及碳减排量,为节能效果的评估以及政策补贴的申报提供精确的数据支持。
六、适用目标群体与核心价值主张
适用目标群体:
• 存量算力中心(老旧机房)运维负责人、业务连续性管理总监;
• 金融、政务、AI、医疗等
• 核心业务领域的机房决策者;
• 面临 PUE 合规压力,需快速完成改造的企业运营商;
• 计划提升算力密度,且担心改造影响业务的项目负责人;
• 关注投资回报周期与运维效率的项目投资方。
核心价值主张:
• 业务零中断:采用插拔式安装方式,在整个改造过程当中都不会对业务运行产生影响,避免出现巨额停机损失的情况。
• 2-3 个月极速落地:借助标准化流程以及模块化设计,可快速达成节能与合规收益的兑现。
• 灵活适配:可与老旧机房实现兼容,又可以适配主流设备,同时还支持 10 至 50kW 的算力进行弹性扩容。
• 安全可靠:有航天级密封技术以及故障预警功能,使得漏液风险几乎为零,实现运维无忧的状态。
• 极致节能:经过改造之后,PUE降低至1.1到1.2之间,每年可节省电费达数千万元之多,投资回报周期为2至3年。
结语:无感升级,塔能重新定义存量机房改造
在算力中心有着“要改、不敢停”这样现实诉求的情况下,塔能插拔式液冷背板凭借“不停机、快部署、高可靠”这些核心优势,突破了传统改造的限制,使得存量机房可实现“无感升级”,不管是老旧机房的节能合规方面,还是核心业务的算力扩容方面,塔能方案都可在保证业务连续性的条件下,迅速达成改造目标,实现节能收益。
塔能科技始终坚守 “好节能,塔能物联网精准节能” 的价值主张,以 “用软件定义硬件,让互联运维更简捷更节能” 为核心理念,持续推动液冷改造技术创新。



