IT时报记者 郝俊慧
在刚刚落幕的2025世界人工智能大会暨人工智能全球治理高级别会议(WAIC 2025)上,由曦智科技、壁仞科技、中兴通讯联合打造的“分布式OCS全光互连芯片及超节点应用创新方案”,获得2025世界人工智能大会最高奖“SAIL奖”(Super Al Leader,卓越人工智能引领者奖)。这也是壁仞科技继2022年之后再次斩获SAIL奖,并成为SAIL四大评价维度(Superior, Application, Innovation, Leading)中“Innovation”(创新)维度的标杆案例。
两天后,7月28日,上海仪电联合曦智科技、壁仞科技、中兴通讯,正式发布国内首个光互连光交换GPU超节点,并即将于上海仪电智算中心落地。
可弹性部署的超节点
今年的WAIC 2025上,超节点成为诸多国产算力厂商展示的热门方案。
当前AI集群架构的发展已经进入“光电融合”时代,而从铜缆转向光互连的趋势,正在为超大规模智算集群提供新的物理支撑逻辑,然而仅靠堆叠GPU或提升冷却能力,已难以应对能效比、可拓展性与系统容错等多重挑战。
尤其是在国产算力暂时还无法与国外算力具备同等能力的前提下,底层架构的更新已成为中国智算产业能否实现自主演进的决定因素。
超节点架构通过深度整合GPU资源,在超节点内构建起低延迟、高带宽的统一算力实体,成为支撑这一演进的关键技术路径。
此前,超节点常见方案是通过提升单机柜功耗来部署更多GPU,但受限于数据中心单机柜的功耗天花板,单机柜GPU密度提升存在瓶颈,而光跃LightSphere X采用光互连技术,通过增加机柜数量构建超节点,突破传统互连方式下超节点的物理限制。
不同于传统的集中式交换,光跃LightSphere X通过在每个GPU上集成光交换功能,可灵活切换GPU间互连拓扑结构,按模型算力需求动态调整超节点规模,切换拓扑网络。
也就是说,基于光跃LightSphere X的超节点可在现有机房部署,不仅降低了成本,而且可按算力需求动态调整超节点规模,分阶段建设。
据了解,分布式设计支持GPU高带宽通讯域弹性扩展。光跃LightSphere X将实现2千卡规模部署。
国产算力产业链大集结
此次获奖的光跃LightSphere X,是国产算力芯片产业链的一次完整集结。
该超节点基于曦智科技全球首创的分布式光交换技术,核心是曦智科技全球首创的基于硅光子技术的分布式光交换dOCS(distributed Optical Circuit Switch)芯片。
dOCS芯片和壁仞科技自主原创架构的大算力通用GPU液冷模组与全新载板互连,并搭载中兴通讯高性能AI国产服务器及仪电智算云平台软件,构建起高带宽、低延迟、灵活可扩展的自主可控智算集群新范式。
目前,国产GPU类型、架构庞杂,协议各有区别,难以形成协同效应。而光交换本身不依赖于特定的数据传输协议,这意味着它能无缝兼容不同厂商使用的互连协议。
记者在WAIC 2025现场看到,除了壁仞之外,摩尔线程、沐曦、燧原等国产芯片都与曦智有合作的模组方案。
上海仪电表示,光跃LightSphere X依托上海仪电算力底座,集合国内智算领域头部企业,共建了“光芯片—GPU—服务器—算力集群-智算云平台”闭环,打造了开放共享的光电融合算力生态体系。
未来,光跃LightSphere X将作为新一代智算集群核心架构,支撑全栈自主可控的国产算力池建设,助力中国AI算力基础设施实现跨代发展。