今天分享的是:2025年面向800G1.6T光模块的液冷关键技术白皮书
报告共计:26页
智算中心散热新突破!800G/1.6T光模块液冷技术白皮书解读
随着人工智能技术的飞速发展,智算中心对算力的需求呈爆发式增长,高算力与低时延已成为行业核心诉求。这一趋势不仅推动交换机传输性能持续升级,也让散热系统面临前所未有的挑战,液冷技术在交换机领域的应用加速推进,其中光模块的液冷方案因系统级复杂性成为关键技术难题。
为应对这一挑战,锐捷网络与京东云等企业组成联合团队,从实际应用场景出发,深入剖析现有光模块技术架构与散热瓶颈,成功开发多种原型样品,并发布《面向800G/1.6T光模块的液冷关键技术白皮书》,系统梳理光模块液冷技术的发展现状、核心难点与未来方向。
光模块散热需求紧迫,液冷成必然选择
在智算中心架构中,GPU『服务器』是核心基础设施,但交换机与光模块对整体算力传输效率同样至关重要。随着光模块传输速率不断提升,其功耗也持续攀升。数据显示,当光模块速率达到3.2T时,功耗将超过40W,传统风冷技术已难以满足散热需求,转向液冷技术成为必然趋势。
光模块的散热并非单纯的热量导出问题,还涉及结构设计、材料制程等多方面,属于系统级工程。从结构设计来看,光模块属于动件,其周围的鼠笼、冷板等部件存在一定公差,这就要求冷板具备灵活性,以适应各部件的浮动公差。同时,MSA标准对光模块插拔力有明确要求,例如OSFP模块插入力最大不超过40N(若鼠笼带有滑动散热器则为55N),拔出力最大不超过30N(若鼠笼带有滑动散热器则为45N),极限公差可能导致光模块与冷板连接过紧,增加运维难度。
从材料角度而言,光模块在机房运维中插入方向和位置难以精准控制,若冷板与光模块接触位置粘贴的导热材料不具备耐磨擦特性,极易在插拔过程中损坏。一旦采用干接触方式,热阻会大幅增加,当光模块功耗达到32W时,部分热点温差可高达25.6℃,严重影响设备正常运行。此外,光模块表面温度需低于70℃才能保障稳定工作,这对液冷冷板的散热效率提出了极高要求。
主流液冷方案各有优劣,技术路径差异明显
目前行业内已出现多种光模块液冷方案,不同方案在可靠性、散热性能和适用场景上各有特点。
Nvidia与HPE采用热管传导热量的方案,通过热管将光模块产生的热量导出至冷板,这种方案可靠性较高,冷板不直接与光模块接触,可减少对光模块的影响。但该方案导热路径较长,热量需经过光模块、铜块、TIM(导热界面材料)、热管、TIM再到冷板,在低功耗场景下可满足需求,面对高功耗光模块时,散热效能会明显下降。
Molex推出一体式冷板方案,在每个光模块位置设计浮动装置以应对浮动公差问题,冷板直接与光模块贴合,散热路径大幅缩短,散热性能优于热管方案。不过,浮动装置的长期可靠性仍需进一步验证,若一体式冷板底部缺乏独立浮动装置,将无法有效解决光模块的浮动问题。
Ciena则提出两种不同思路的方案:一种是采用软管连接光模块冷板,利用软管特性解决浮动公差,冷板直接接触发热源提升散热性能,但软管需通过卡箍连接,泄漏风险随支路数量增加而倍数上升;另一种是在光模块上直接设计液冷方案,搭配微型快拆接头,不过微型接头的流阻控制和可靠性要求极高,且目前具备相关产品生产能力的厂家较少,供应链交付存在风险。
原型样品成果显著,多项关键指标达标
联合团队基于光模块产品要点和行业分析,明确原型样品需满足单一光模块发热量至少32W、采用分离式冷板、管路独立且灵活、冷板高度不超过7mm、承压至少800kPa等核心需求,并与同裕科技、苏州大图、文轩热能、万亨达四家液冷厂商合作开发出多款原型样品。
从关键需求满足度来看,四家厂商的样品均实现分离式冷板设计,文轩热能、苏州大图、万亨达采用金属波纹管提升冷板灵活性,同裕科技则使用铜管;冷板高度方面,万亨达样品最低,仅6.3mm,其余三家均控制在7mm;气密性测试中,万亨达样品表现最优,24小时内变化率仅0.1%,所有样品均支持侧边入出水。
在性能测试中,入水温度40℃、发热功耗32W、流量0.25LPM的条件下,所有原型样品的冷板热阻均满足最低0.7℃/W的要求。不过,部分样品存在流阻过高的问题,经分析主要原因在于焊接过程中出现焊料溢吸现象,以及为提升散热效果采用高密翅片后,串联设计进一步增加了流阻。
值得关注的是,本次研发中采用浙江宝森金属波纹管支持冷板浮动特性,这种波纹管此前已在医用、智能制造、化工等领域广泛应用于温度、压力、流量传感,将其技术转移至光模块液冷领域,可使冷板具备独立性、减震和柔性连接特性,是一项重要的技术创新。该波纹管外径小于5mm,工作压力可支持1.75MPa,有效适应光模块狭小的安装空间和高压工作环境。
未来技术方向明确,多维度突破待推进
尽管当前光模块液冷技术已取得阶段性成果,但仍存在较大的发展空间,未来将从多个维度持续优化升级。
在流阻优化方面,光模块液冷冷板属于微型冷板,对焊接工艺精度要求极高,需避免焊接过程中出现焊环堵塞现象,同时优化冷板内部微结构设计,在保证散热效率的前提下降低流阻,确保液冷系统整体运行效率。
导热材料研发是另一重要方向,若能开发出具备耐磨性、可多次使用且不易损坏的导热材料,将有效提升光模块与冷板之间的热传导效率,甚至可减少冷板内微结构的设计需求,进一步降低流阻,简化冷板结构。
波纹管微型化也是关键发展趋势,虽然波纹管能有效解决浮动公差问题,但光模块安装空间有限,对波纹管尺寸提出了更高要求,需要相关厂家配合开发更微型化的产品,以适应光模块高密度部署需求。
此外,表面处理工艺也需升级。目前IT行业通常采用镀镍技术保证散热模块的抗腐蚀性能,但镀镍会导致波纹管和冷板的柔软性下降,影响其浮动调节能力。未来需要研发更先进的表面处理工艺,在确保抗腐蚀性能的同时,保持部件的柔软性,保障液冷系统长期稳定运行。
随着智算中心持续向更高算力、更高密度方向发展,800G/1.6T光模块将逐步成为主流,液冷技术作为解决其散热问题的核心方案,必将迎来更广阔的发展空间。此次白皮书的发布,不仅为当前光模块液冷技术研发提供了重要参考,也为行业未来技术发展指明了方向,将推动产业链上下游企业加强合作,共同推动光模块液冷技术不断创新,为智算中心的稳定高效运行提供有力支撑。
以下为报告节选内容
报告共计: 26页
中小未来圈,你需要的资料,我这里都有!