今天分享的是:2025年光电路交换设备O3S硬件设计规范书
报告共计:21页
智算中心网络升级新突破!O3S光电路交换设备规范发布,助力大模型训练效率跃升
随着千亿级参数大模型训练需求的爆发式增长,智算中心对『数据中心』互连网络的要求日益严苛。模型并行训练产生的突发性“大象流”数据,常需跨集群协同传输,而传统静态波分系统面临带宽固化、故障恢复慢、光电转换时延累积等瓶颈,已难以支撑高吞吐、低时延、高弹性的网络需求。在此背景下,开放『数据中心』标准推进委员会(ODCC)于2025年9月发布《光电路交换设备O3S硬件设计规范书》,为智算中心光互联领域提供了统一的硬件设计标准,有望推动行业技术升级与生态协同。
O3S(Optical recovery optical routing optical switching switch)交换机作为此次规范的核心对象,凭借创新技术特性打破传统网络局限。一方面,它通过构建智能化光层带宽池,将离散的波长资源整合为共享带宽池,能够快速调配带宽以满足突发性大象流的数据传输需求;另一方面,其快速光重建能力与无需光电转换的特性,可在『数据中心』互联(DCI)波分光互联故障场景下实现快速恢复,并有效降低光电延时,为智算中心构建起支持400G/800G超宽谱传输的智能化光互联底座。
在技术原理与信号流转方面,O3S设备的业务波上下行机制设计巧妙。上行过程中,业务波从S端口输入后,会映射到48个映射端口中的任意一个,这些映射端口通过1:3耦合器耦合至1路输出,最终实现16端口输入、16端口输出的CDC光路由。这种设计相较于每个端口独立映射输出的方式,能在输出端节约2/3的光纤,大幅提升布线效率,但需提前将输入信道规划为不同波长,确保信号传输稳定。下行过程与上行对称,借助1:3分光器,每个下行S端口会输出3个波长,通过相干接收可过滤掉非本端业务波。不过,1:3分光器和耦合器会引入6.5-8dB的插损,叠加光交换设备本身3-4dB的插损,会对业务波造成较大衰减,因此规范建议在波分侧引入增益为9.5-12dB的放大器,以保障信号强度📶。
从应用场景来看,O3S设备为智算中心网络解决了两大关键难题。在多维度『数据中心』互联带宽池化场景中,传统DCI场景下园区间互联带宽固定,无法动态调整。例如,若D园区有19.2T的突发带宽需传输至A园区,但建设阶段仅为DA方向分配了12.8T带宽,传统方案需在数通层面增加跳数,通过B-D-A的绕行路径转发额外6.4T带宽,这会显著增加时延。而O3S设备凭借全光交换能力,可在D园区流量出口前建立池化带宽,将前往多个园区的流量整合,根据大象流需求进行路由重构,直接将19.2T带宽动态分配到DA波分系统,既满足流量需求,又降低转发时延。同时,只需调整交换机上的相应波长,并在O3S设备上重建光路映射,即可实现临时带宽扩容,无需改纤操作,大幅节约人力资源并提升效率。
在故障自愈场景中,O3S设备的快速切换能力(通常小于50ms)展现出重要价值。当检测到设备上某对光端口之间光路故障时,设备可快速切换到其他冗余的端口映射对,重新建立有效光路;若波分链路出现光纤故障,也能通过调整映射对,快速利用冗余平面或链路承载光信号。这种快速自愈能力,能有效维持网络的高可用性和稳定性,为智算中心的持续运行提供可靠保障。
规范书还对O3S设备的核心指标与硬件设计进行了详细界定,确保设备性能达标且具备可落地性。在光学性能方面,O3S设备支持C+L波段(1530-1625nm)的波长范围,插入损耗最大不超过12dB,时延控制在45ns以内,切换时间最短可达30ms,重建时间不超过200ms,且具备优秀的抗干扰能力,静态串扰低于-55dB,动态串扰低于-45dB,能有效保障信号传输质量。环境适应性上,设备可在10-45℃的工作环境温度、8%-80%RH的工作环境湿度下稳定运行,运输和存储阶段也能承受-40-70℃的温度范围与5%-90%RH的湿度范围,同时设备输入光功率范围为-15-15dBm,电气功耗不超过200W,兼顾稳定性与节能需求。
硬件设计层面,O3S设备机框高度为2RU,可安装于标准『服务器』机架或600毫米深的机柜,采用全无源组件设计以提升可靠性。机框左侧槽道为工艺接口模块(CIM)专用安装位,提供以太网、控制台及USB接口,满足本地运维需求;右侧槽道安装光交换引擎板卡,承担光通道交互与切换功能。机框背面支持单控制单元(CU)、双电源模块(PSU)及双风扇模块(FAN)布局,且电源与风扇模块均采用1+1冗余设计——电源模块单个最大负载550W,正常工作时并联分担负载,单模块故障后另一模块可立即承担全部供电;风扇模块协同运行,单模块故障时另一模块满负荷运转,结合“前进后出”的定向风道设计,确保机框内部散热均匀,避免温度过高影响设备运行。此外,控制单元作为机框核心中枢,内置SD卡实现数据持久化存储,可实时采集并保存系统遥测数据、操作日志及配置参数,为故障诊断提供支撑。
在实际部署中,O3S设备需与光线路放大器(OLS)、合分波设备(MUX)及交换机协同工作。其中,OLS的作用尤为关键,由于节点内1×3光分路器在分路过程中会产生插入损耗,OLS可对波分侧光信号进行放大,有效补偿这部分损耗,确保业务波光功率维持在合理区间,保障节点间业务稳定传输。
此次《光电路交换设备O3S硬件设计规范书》的发布,不仅为O3S设备的研发、生产与应用提供了统一标准,帮助用户降低测试与适配成本,更将推动智算中心光互联领域的技术标准化与生态化发展。随着O3S设备在智算中心的逐步落地,其全光交换矩阵、智能管控接口及高可靠架构设计,将为大规模AI训练任务提供更可靠的传输能力,助力大模型训练效率实现跨越式提升,为数字经济时代的智能产业发展注入新动能。
以下为报告节选内容
报告共计: 21页
中小未来圈,你需要的资料,我这里都有!