作者:金旺
快接头,庞大的数据中心中一个极容易被忽视的小组件。
却也是数据中心产业链中出货量巨大,又关乎数据中心液冷服务器安全稳定的组件。
尤其是在液冷技术在国内火爆后,英特尔技术专家在一年前的一次深入考察液冷生态系统时,从ODM、OEM等伙伴处发现了一个普遍存在的问题:
由于数据中心经常涉及到设备迭代,当运维人员在进行机房运维工作时,经常会遇到不同厂商的快接头无法互插。
是否可以在不同快接头之间形成一个互插互换的测试标准,就成了摆在英特尔数据中心与人工智能事业部面前的一个问题。
于是,英特尔在一年前启动了这一项目,据英特尔数据中心与人工智能事业部中国区生态拓展总监徐冉后来回忆称,“当时我们预计两个季度就能完成这项工作,但后来发现,互插测试远比我们想象的要更复杂。”
在随后这一年里,英特尔联合英维克、丹佛斯、立敏达科技、蓝科电气、正北连接五家UQD快接头厂商,对250组样品、32种测试项目,进行了上千次测试。
8月19日,这一测试项目最终完成,英特尔通用快接头互插互换联盟也正式成立,这也为液冷技术方案在国内数据中心进一步推广应用扫除了又一魔障。
数据中心的“接头难题”
在数据中心液冷系统中,往往有大量的快接头存在,这些快接头的作用是快速连接、断开液体冷却管路,从而方便维护和更换组件,并最大程度地减少液体泄漏。
因而,快接头在一定程度上决定了数据中心液冷系统维护的难以程度,也关乎着数据中心的安全稳定运行。
作为OCP UQD项目发起者,英特尔早在2019年就提出了通用快接头标准,不过,英特尔数据中心和人工智能事业部中国区平台技术研发部总监杜黎光指出,“英特尔最早只是联合业界在这项标准中基于OCP统一了快接头的关键尺寸,确保不同厂家的快接头在机械尺寸上能够匹配、插紧。”
但这项标准只保证了最基本的对接问题,至于采用不同快接头插紧后,是否能达到原厂的效果、是否足够好用,原有标准中并没有进行详细规定。
更何况,在2019年,液冷技术方案在国内数据中心中还并非主流技术,大多数厂商依然秉持着观望态度,这也让整个行业对OCP UQD标准没有给予足够重视。
蓝科电气总经理陈杰指出,“直到2022年底ChatGPT的发布,我们开始迈入到AI时代,液冷技术在国内开始火爆起来。”
正是在液冷技术不断升温,成为更多数据中心的选择时,之前只是规定了快接头尺寸标准的OCP UQD也就需要再往前走一步,真正解决快接头互插互换过程中安全稳定问题。
对此,杜黎光给出的一个更为直观的例子:
数据中心机架上如果装了某一厂商的服务器,在与机架上快接头进行插合时,如果选用的是同一家厂商的快接头,无论是在吻合程度、可靠性,还是防泄露能力,都会有很好的表现。
但如果选用的不是同一家厂商的快接头,是否会有一样的效果,这还从未有人进行过验证。
由于数据中心的机架寿命在10年以上,服务器迭代周期往往只有2年左右,出现液冷服务器的快接头与机架上的不一致也就成了常见的事。
正因如此,2024年,推动不同厂商之间的快接头互插互换接近、乃至达到原厂水平,就成了英特尔中国数据中心液冷创新加速计划中的一项重要工作。
这一年,英特尔先是经过综合考虑遴选出了五家本地UQD快接头厂商,后又基于英特尔产品品控要求和可能失效模式分析,制定了全面的互换测试标准和流程。
在这个过程中,首先是各家参与测试的厂商进行自插自配测试,以此确保自身的兼容性,在此基础上再进行两两组合的互插互配测试。
据杜黎光透露,各厂商产品往往自插自配时表现良好,但在互插互配时就会出现各种问题。
例如,弹簧是快接头的关键部件,而弹簧的软硬程度、压缩间距的标准往往是一个范围,各家厂商在快接头设计过程中,由于软硬程度和压缩间距选择的标准值不同,就会导致互插互换时密封不严,乃至无法匹配的情况。
这时,联盟的作用就是协调各方,针对参数差异进行沟通,共同商定优化方案。
在过去这一年里,英维克、丹佛斯、立敏达科技、蓝科电气、正北连接五家UQD快接头厂商的250种样品,共进行了32次测试项目,上千次测试。
与此同时,英特尔测试团队打通了冷板、冷却液等上下游产业链进行联合测试,期间发现了多种失效模式并制定了相应的改进方案。
这才有了英特尔通用快接头互插互换联盟的正式成立。
即将进入的液冷时代
据IDC统计数据显示,2024年中国液冷服务器市场规模达到23.7亿美元💵,同比增长67%,预计2029年将会进一步达到162亿美元💵。
液冷技术,正在成为数据中心应对算力持续增长、功率不断提升、散热需求越来越高的一项关键技术。
不过,徐冉也特别指出,目前液冷行业仍处于起步阶段。
为此,英特尔早在2024年就推出了英特尔中国数据中心液冷创新加速计划,据杜黎光透露,目前这项计划已经开展了以下几个重要项目:
第一,冷板整体方案测试认证,英特尔审议了英维克作为英特尔BHS-AP平台冷板方案整体供应商,整体方案包括冷板、管道、快接头和CDU,每个部件英特尔都定义了认证测试的方法。
第二,浸没式液冷项目,英特尔联合绿色云图、新华三、埃克森美孚共同推出了基于合成油的G-Flow液冷解决方案,该方案成功克服了合成油散热能力的局限,能够将散热功率大幅提升,实现了环保与高效散热的兼顾。
第三,冷板液冷液体测试项目,冷板相当于人的循环系统,泵出的液体通过管道流出去,这当中的液体非常重要,英特尔此前验证了一些液体供应商,现在推荐的液体含有冷冻液和抗腐蚀、抗菌合成配方的PG25。
第四,OCP UQD快接头互插互换项目,英特尔联合英维克、丹佛斯、立敏达科技、蓝科电气、正北连接五家厂商完成了OCP UQD快接头互插互换,并成立了英特尔通用快接头互插互换联盟。
值得注意的是,此次进行互插互换测试的快接头,是市场上更为主流的04型号的快接头,徐冉指出,“未来如果我们的OEM、ODM或CSP客户有更多需求,并提出测试其他产品或引入新供应商的建议,我们一定会认真考虑并付诸实施。”
至于英特尔此次成立的这一联盟接下来在技术层面的工作重点,杜黎光指出,“首先会做好后续服务与问题追踪,持续关注客户应用过程中可能会出现的互插互换问题并及时解决,其次也会根据技术发展方向与业界合作,根据实际需要对UQD标准进行迭代升级。”