创新技术从“天上”落入“凡间”,是贯穿科技发展史的主旋律,而“开放”无疑是整个乐谱中的最强音。
在IT产业的萌发阶段,大型机和小型机只是少数用户的奢侈品,直到倡导开放架构的PC Server大行其道,各个行业的数字化进程才拉开序幕;在移动互联网浪潮的开端,高高在上的智能手机也曾让大多数人望而却步,所幸以开放著称的安卓平台打破垂直生态的垄断,为后续的一路繁花扫除了障碍。
如今,人工智能变革同样处于加速爆发的关键节点,两个“万亿”对算力系统架构提出前所未有的挑战:一是国内外前沿大模型的参数量快速突破万亿规模,键值缓存(KV cache)激增离不开超大显存空间承载,且通信敏感型计算对通信延时要求极高,依靠单芯片或节点的性能提升已难以为继,亟需构建更大向上扩展(Scale up)的高速互连域;二是预期规模高达万亿元的智能体市场全面启动,多模型协作的新范式渐成主流,其推理过程会生成比传统模型多近百倍的数据词元(token),打造新型的算力底座迫在眉睫。
正是在这样的背景下,超节点(SuperPod)脱颖而出,其通过高速互联技术将大量GPU/NPU整合为单一逻辑计算单元,突破传统算力架构的瓶颈,实现算力密度和协同效率的跃迁。不过,与很多重大创新的演进轨迹类似,超节点也会面临曲高和寡的烦恼,如何依循开放路径达成普惠目标,是其必须解决的难题。
显而易见,这条路充满荆棘——碎片化的协议、差异化的算力、离散化的生态都是构建开放式架构超节点的阻碍,唯有积累深厚、锐意进取的系统级厂商,才有可能闯出一片新天地。在近日举办的2025开放计算技术大会上,面向万亿参数大模型的超节点AI服务器“元脑SD200”率先交出答卷,其基于浪潮信息创新研发的多主机低延迟内存语义通信架构,以开放系统设计向上扩展支持64路本土GPU芯片,为超节点大规模商用铺平了道路。
一切并非从天而降:跨最高的山,渡最长的河纵观开放计算技术的进化历程,会发现成功者通常具备两大能力:一方面要善于把握千载难逢的历史性机遇,另一方面必须在时间窗到来之前做好充分准备。
事实上,元脑SD200绝非从天而降,浪潮信息是在跨越“最高的山”、渡过“最长的河”之后,才在较短时间内找到了破解超节点迷局的最佳路径。
时光要追溯至十几年前。在富有传奇色彩的关键应用主机K1研发过程中,浪潮信息取得多项重大突破:自主研发32颗中央处理器互联芯片,攻克多 CPU、高速、缓存协议等设计难题,使其能像单个大脑一样协同运转,为化解超节点的一致性挑战埋下了伏笔;K1还首次将交换机中的正交背板技术应用于大型系统,能最大化保障系统I/O稳定性与高性能,而NVIDIA最新一代NVL144超算架构经过多代演进后,最终也采用了类似的背板设计。跨最高的山,意味着丰富的技术沉淀与积累,这也为浪潮信息研发超节点架构提供了重要支撑。
越过山丘,才发现还有支流交汇的大河。2014年,浪潮信息开创性地提出融合架构理念,致力于通过硬件解耦实现资源的物理池化和动态重构,借助软件定义达成业务感知的按需资源组合与配置,满足系统的弹性伸缩和超大规模扩展,探索软硬高度协同的发展道路。
浪潮信息副总经理赵帅
浪潮信息副总经理赵帅认为,从某种意义上讲,超节点正是脱胎于融合架构逾十年的持续积累。从融合架构1.0时期比较简单的电源风扇整合,到IO、硬盘资源池化探路,再到3.0阶段完成内存资源池化,实现计算节点内部各种算力芯片共享内存数据、统一编址和协同工作,以及节点之间基于智能数据处理单元和高速网络形成分布式互连交换。这些技术创新叠加供应链层面的“演练”,为开放式架构超节点的产品研发与商用落地奠定了坚实基础。
打造开放式架构超节点:贴近用户需求,软硬协同突围如果说核心技术与产业链资源的长期积累是打造开放式架构超节点的必要条件,那么回归本源——以应用为导向,贴近用户需求构建切实可行的解决方案,则是其惠及千行万业、实现普惠目标的必由之路。
来自市场前线的大量“一手”行业需求显示,客户“渴望有更多的选项”,以应对纷繁场景的挑战,而开放式系统显然更有机会冲破重围。作为业界领先的系统级厂商,浪潮信息敏锐地洞察到客户需求,通过架构和系统层面的软硬协同创新,树立起开放式架构超节点的新标杆。
架构突破具有纲举目张的作用,是超节点解决客户难题的先决条件。元脑SD200基于自主研发的开放总线交换技术首创多主机三维网格系统架构,实现64路本土GPU芯片高速互连;借助创新远端GPU虚拟映射技术,使显存统一地址空间扩增8倍,单机可提供最大4TB显存和64TB内存,为大模型提供充足键值缓存空间。此外,依托百纳秒级超低延迟链路,构建64卡大高速互连域统一原生内存语义通信,在实测的小数据包通信场景中,全规约(All Reduce)性能表现优异。
系统创新是扫除深层障碍的不二法门,堪称超节点助力客户攻坚克难的最优解。根据万亿参数大模型计算、通信需求特征,浪潮信息开发智能总线管理系统,实现超节点64卡全局最优路由的自动创建,支持不同拓扑切换,资源按需切分;对于全规约、全聚集等典型通信算子,开展不同数据量大小的细粒度通信策略设计,如多层级通信机制等,促使通信时延进一步降低;依托开放的PD分离框架,支持异步KV Cache高效传输与差异化并行策略,在提升业务服务级别目标的同时保持对多元算力的兼容性,促进计算与通信深度协同优化。
尤值一提的是,元脑SD200还充分考虑到行业客户的快速部署需求,以成熟技术降低应用门槛,有望推动开放式架构超节点加速渗透。目前,市场中的一些超节点产品对客户的基础设施要求很高,必须具备高压供电、液冷、光模块等条件,才能部署完成。这不仅增加了客户的成本压力,而且由于光模块等部件的故障率居高不下,也可能影响系统的正常运行。据赵帅透露,元脑SD200采用了电互联、风冷等成熟技术,客户可以在已有的数据中心进行部署,业务上线快且系统运行稳定,驱动超节点的真正商用向前迈出一大步。
算力与算法比翼齐飞:开放带来创新热潮与生态繁荣从AI加快落地节奏的角度看,开放式架构超节点迈出的坚实步伐,恰是对今年初以来DeepSeek、Qwen、Kimi、GLM等开源大模型迅猛崛起的积极回应,算力与算法比翼齐飞、开放与开源协力并进的潮流渐趋成型。
值得关注的是,浪潮信息长期以来始终是开放计算的倡导者和践行者,在开放加速规范(OAM)和开放算力模组规范(OCM)演进的过程中扮演着举足轻重的角色。构建开放式架构超节点的崭新生态,也是浪潮信息的重要使命,与产业链上下游共建硬软件、互联、管理等标准体系任重而道远。
赵帅认为,开放会带来更多的技术创新与良性的市场竞争,最终会促进整个生态的繁荣。最大的受益者是用户,如果开放生态让超节点的成本变成以前的1/5、1/10甚至1/20,一定会有更多的用户愿意接受新技术,并从中得到不菲的回报;与此同时,这也会带动产业链的各个环节增强投入的信心,摆脱“内卷”困局,携手在国际市场赢得更多话语权。
站在更长远的视角,超节点并不是算力基础设施进化的终点,数据中心才是未来决战的焦点。从过去的“Server as a Computer(服务器即计算机)” ,到当下的“Rack as a Computer(整机柜即计算机)”,再到“DataCenter as a Computer(数据中心即计算机)”,浪潮信息将与合作伙伴在开放计算的道路上继续前行,算力底座的未来图景值得期待。