在通向AGI时代的宏大叙事中,算力是最具战略意义的基础设施。新华三集团高级副总裁、云与计算存储产品线总裁徐润安说,“今天所有对算力的创新与尝试都是值得的。”
的确,每一次算力架构的突破,每一份工程化实践的积累,都在为未来AGI的繁荣奠定基石。而超节点,其实可以看做当前算力创新的一个重要标志,它代表了算力工程化创新的极致水平。
我们知道,智算中心正从 “简单粗放的堆算力” 转向 “精打细算的挤效率”,这要求多元算力从分散部署走向泛在协同,超节点的出现则以极致的密度、效率与协同能力,成为当下算力工程化创新的标尺。
但同样叫做超节点,其内在的架构和技术方向可能完全不同,在开放和封闭的不同选项中,超节点要如何走出一条创新之路?
超节点的路径分歧:开放VS封闭
众所周知,传统数据中心的算力增长往往依赖算力设备的堆砌来实现,这种方式虽然简单直接,但随着数据中心的规模越来越大,开始面临着效率递减、能耗攀升、管理复杂度倍增等挑战。
客观的说,超节点的诞生就源于对算力效率的极致追求。简单的说,超节点是将服务器、存储、网络、散热等要素进行系统性重构,通过硬件集成优化与软件协同调优,实现算力密度与能耗比的全面突破。这对于与日俱增的人工智能训练和推理算力需求,无疑是一个破局的关键。
徐润安指出,超节点创新主要体现在三个维度:“首先是算力密度的突破,通过创新的整机柜设计、先进的液冷技术和精密的电源管理,在有限空间内实现算力的指数级增长;其次是通信效率的革命,通过低延时、高带宽的互联技术,打破传统服务器间的数据交换瓶颈;最后是系统调优的深化,通过软硬件协同设计,使多元算力能够高效协同工作,这三个维度的创新共同构成了超节点技术的核心竞争力。”
当然,既然是“工程化创新”,就意味着超节点不存在既定的标准,因此一个超节点的发展呈现出两种截然不同的技术路线:封闭式生态与开放式生态。
顾名思义,“封闭式”超节点,是以单一厂商的芯片与软件栈为核心,通过垂直整合实现极致性能。其优势在于软硬件协同度高,开发周期短,能快速投向市场,并满足特定场景需求。
但由于生态的封闭性,会让一些客户担心被技术锁定,且难以适应当下国产算力多元化的发展趋势。对此,新华三集团云与计算存储产品线副总裁、产品支持与解决方案部总经理武家春说,“新华三更强调开放式的合作,我们认为,要选择什么样的GPU这份选择权要交给客户,然后我们会根据客户的需求,来搭适合客户需求的超节点。”
很显然,开放生态的超节点,会适配多品牌 GPU,乃至多类型存储协议与多元网络架构,并通过标准化接口实现跨厂商协同。这种模式更好地满足了算力多元化的需求,我们也不能忽视技术对齐困难、研发周期长等挑战。
当然,无论是封闭还是开放,超节点的核心价值始终指向“好用的算力”。
正如徐润安所指出的,今天的智算发展正处于“螺旋上升的过程”,而超节点正是推动这一螺旋向上的关键动力。它不仅解决了当前算力供给与需求之间的效率错配,更在为未来多元算力融合奠定基础。我们相信,在国产算力崛起的大背景下,开放式超节点有机会成为推动智算产业整体进步的关键路径。
布满荆棘的开放之路,技术对齐与生态协同成最大考验
新华三集团云与计算存储产品线 智慧计算产品市场部总监汤涛表示,“从产业的角度,封闭生态一定不利于发展,所以新华三会选择坚持走开放式生态的路线。”
而这条路的前方,实则也布满了不确定性的荆棘。因为开放式超节点的构建远比封闭式系统更复杂,这是一项需要协调芯片厂商、整机厂商、软件开发商等多方力量的系统工程。
首要挑战在于技术对齐。在开放生态中,各GPU厂商的技术路线、接口标准、研发节奏各不相同,如何实现硬件层面的互联互通成为巨大难题。
徐润安坦言,“比如芯片设计需要12-18个月周期,整机开发又需要9-18个月,而AI技术每12-18个月就会发生代际演进,所以在最后形成交付的时候,我们会面临从设计理念、生产制造再到最后交付环节的重重挑战。”
其次,异构算力的高效协同是另一座待攻克的高峰。当前国产GPU呈现百花齐放的态势,各家在架构设计、互联协议、性能特点上各有所长。有的擅长高并发推理,有的专精大规模训练,有的则在能效比上表现突出。这意味着,超节点要整合这些差异化算力,不仅需要硬件接口的标准化,更需要软件栈的深度适配。
而在此过程中,存储和网络性能也是常被忽视的“隐形瓶颈”,英伟达创始人黄仁勋曾提出,“现在很多人都已经知道AI该怎么用GPU,但AI怎么用网络,AI怎么用存储,现在是还缺少人研究。” 确如其言,当算力达到一定规模后,存储I/O和网络延迟往往成为制约整体效率的关键因素。而新华三的长处就在于除了算力之外,同样拥有在网络和存储领域的技术积累,这是业界大部分厂商都不具备的优势。
最后,则是最复杂的生态协同的挑战。开放生态意味着需要建立全新的产业协作机制,从芯片设计阶段就要开始协同规划,贯穿产品全生命周期,这需要有综合技术实力的厂商能够牵头推动协同机制的运行,“而新华三愿意站出来,承担这样的工作”。徐润安说。
以“算力×联接”战略,对应国产算力崛起的历史机遇
面对如此复杂的挑战,为什么一定要坚持开放路线?答案在于:国产算力的历史性机遇。
历史已一次次向我们证明过:唯有多元竞争才是技术进步的源泉,开放生态的建立,虽然前路艰难,但却是实现AI普惠、打破技术壁垒的必由之路。
正因如此,新华三选择承担起这一责任,通过“算力×联接”战略,为国产算力提供协同创新的平台。
“算力×联接”的本质,是通过算力方案与联接方案做最佳的调优和配合,通过端网协同、网算一体等技术带来智算效率的大幅提升,两者的深度融合带来的不是简单的叠加效果,而是倍增的效益,让智算的价值最大化。
而在算力层面,新华三以“开放多元”为核心,构建起覆盖全场景的算力支撑体系。在超节点方面,全新发布的H3C UniPoD超节点产品以算力芯片多元化、互联协议标准化、基础设施集成化为核心设计理念,主要涵盖H3C UniPoD S80000和H3C UniPoD F80000两个子产品系列。
其中,H3C UniPoD S80000单柜支持最多部署64卡,采用液冷方式散热整柜功率可支持到120KW,同时兼容下一代高性能AI加速卡。面对客户追求极致性能的需求,其柜内卡间全互联通信,互联带宽提升8倍,单机柜训练性能相较于单节点最高可提升10倍,单卡推理效率提升13倍。
H3C UniPoD F80000则依托全国产算力平台,采用创新的PCIe光互联技术,突破单机板内走线限制,实现了64张AI加速卡的高速互联,将卡间带宽大幅提升至576GB/s,实现模型训练性能提升35%以上,并支持按需定义产品拓扑16/32/64卡,实现灵活按需交付。
随着AGI时代的临近,“百花齐放”的算力生态将是实现算力平权和AI普惠的关键。在这条道路上,既需要技术上的锐意创新,也需要生态上的开放包容,更需要产业担当,而这正是新华三的责任与使命。