光时代,CPO会是『英伟达』的下一个“宏大叙事”吗?

光时代,CPO会是『英伟达』的下一个“宏大叙事”吗?

科创板日报》1月19日讯 GPU新品出现散热问题、大客户订单受影响,这些天的『英伟达』,或许并不好过。想要保住“算力霸主”的宝座,这家巨头亟需一剂良药。

日前有消息称,『英伟达』将在今年3月的GTC大会上推出CPO交换机,若试产顺利,则有望8月量产,届时CPO交换机可实现115.2T的信号传输。

媒体援引供应链猜测称,“针对(CPO交换机)产能,『英伟达』非常着急。”

虽然黄仁勋对外宣称供货一切顺利,但目前GB200系列出货实在不容乐观。GB200 NVL72机柜设计复杂,高性能计算带来了高功耗及高散热需求。零部件厂商表示,单机柜问题已经“大致解决”,但多机柜连接问题“巨大”——机柜连接需要高达8万根铜线,散热、信号干扰等问题陆续浮现。

这不是耸人听闻的夸大其辞——散热和连接的巨大问题,已经影响到了『英伟达』那些顶级大客户的订单。

本周有另一报道指出,微软、亚马逊、谷歌和Meta等公司已经选择推迟Blackwell订单、或直接“弃B(Blackwell)投H(Hopper)”。一方面,GB200的功耗“前所未有得高”,每个机柜功耗高达120-132千瓦,直接将传统冷却系统推向极限。另一方面,Blackwell机柜还出现连接故障,妨碍了热量分配,又进一步加剧了热管理问题。

散热互连问题步步紧逼,『英伟达』拿什么解决?『芯片』级优化,更先进的冷却方案,还是彻底改造机柜?

这一次,光通信或许成为现阶段的最佳技术解药,『英伟达』将目光投向了CPO。

▌7年千倍成长空间与172% CAGR

为什么是CPO?

CPO全称为Co-Packaged Optics,中文译为光电共封装,是一种新型光电子集成技术。通过进一步缩短光信号输入和运算单位之间的电学互连长度,CPO在提高光模块和ASIC『芯片』之间互连密度的同时,实现了更低功耗,已成为解决未来数据运算处理中海量数据高速传输问题的重要技术途径。

在2023年2月发表的一篇研究论文中,『英伟达』研究人员曾直言,“现在,随着CPO面世,我们正处于新一场重大变革的边缘。在CPO架构中,光学器件将和ASIC封装在一起,以降低能耗、实现更高带宽。虽然十年前CPO就已开启系统部署,但最近的一系列研究演示以及相关产品说明都表明,未来几年,CPO将得到市场广泛采用。”

摩根士丹利在最新发布的AI供应链产业报告中指出,CPO具备AI『数据中心』的传输潜力,预估2023年至2030年期间,其市场规模将从800万美元💵激增至93亿美元💵——7年千倍的成长空间,年复合成长率高达172%。

此前有消息称,『英伟达』计划从2025年下半年推出的GB300『芯片』开始采用CPO,Rubin平台(Blackwell下一代平台)也将采用该技术,旨在突破目前NVLink 72互连(最多可连接72个GB200『芯片』)的限制,提升通信质量。

大摩的报告则指出,『英伟达』的Rubin平台及其NVL『服务器』机柜系统,在导入CPO的能见度更高,且每系统中的内含价值更高,预估2027年占全球CPO需求的75%。

▌与巨头同行

不论如何,CPO这条路,『英伟达』也许是选对了,从AMD、思科、IBM到英特尔,都是同行者。

例如1月6日,美国『芯片』大厂Marvell(美满电子)宣布,公司在定制AI加速器架构上取得突破,整合了CPO技术,大幅提升『服务器』性能。这种新架构能让AI『服务器』能力实现拓展,从目前使用铜互连的单个机架内的数十个XPU,拓展到横跨多个机架的数百个XPU。通过这一架构,超大云服务商将能开发定制XPU,实现更高的带宽密度,并在单个AI『服务器』内提供更长距离的XPU到XPU连接,同时具有最佳延迟和功率效率。

2024年末IBM宣布实现一项重大CPO技术突破,可以以“光速”训练AI模型,同时节省大量能源。根据IBM结论,这项CPO技术可以将标准大模型的训练时间从3个月缩短至3周;并且,与中端电气连接相比,能耗降低了5倍多,『数据中心』互连电缆的长度可以从1米延伸至数百米,大幅降低拓展生成式AI的成本。

除此之外,英特尔、AMD、思科等均有在近年OFC展上推出CPO原型机。

▌还有多远?

站在当下节点,CPO这根“稻草”能救得了『英伟达』吗?

或许还需要等待。

在1月16日的投资者会议上,作为『英伟达』CPO合作伙伴台积电的董事长,魏哲家表示,虽然CPO已经有初步成果(Good Result),但想要达到量产阶段仍需要1年甚至1年半以上时间。

另有媒体援引分析师表述称,CPO进度将影响『英伟达』Rubin系列的量产进程。供应链透露,目前“量产确实有难度,尤其是在设备部分仍相当吃紧,另外良率也有待提升”。

值得一提的是,1月16日,针对GB200『服务器』散热问题,黄仁勋表示,Blackwell平台散热技术相对复杂,不过Blackwell系统已开始全面量产,初期面对的挑战对比系统的复杂度,是很正常的,Blackwell系统已开始销售给全球客户。

(科创板日报 郑远方)

特别声明:[光时代,CPO会是『英伟达』的下一个“宏大叙事”吗?] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

美国Oratene百特能犬猫洁牙牙膏2.5oz,真的不用刷牙?实测揭秘!(百特oxiris)

你家毛孩子抗拒刷牙?Oratene百特能犬猫酵素洁牙牙膏2.5oz主打“免刷牙”护理,通过天然酵素分解牙菌斑,适合懒人养宠家庭。本文详解其成分原理、使用效果、适用场景与选购建议,帮你判断它是否真能替代刷牙——是智商税还是真·救命神器?

美国Oratene百特能犬猫洁牙牙膏2.5oz,真的不用刷牙?实测揭秘!(百特oxiris)

哪个洗发膏去屑效果好?去屑控油就选洗发水(什么牌子洗发膏去屑好)

其核心草本配方中,侧柏叶与氯咪巴唑协同作用强力去屑,洗后三天仍能保持头皮清爽;人参和当归的滋养成分渗透发丝,洗时就能感受到发根逐渐强韧的抓力;椰子油与山茶籽形成的天然保护膜,让吹干后的头发呈现出自然的蓬松弧度…

哪个洗发膏去屑效果好?去屑控油就选洗发水(什么牌子洗发膏去屑好)

上海这晚,『孙俪』和『马伊琍』衣品难评,全裹出镜的『宋佳』秒了全场(孙路上海)

这场以"经典尽在于心"为主题的时尚派对,不仅汇聚了『娱乐圈』️的顶级『明星』️,更成为了一场视觉艺术的狂欢。最令人称奇的是她背上的红色人形模特,这个大胆的设计让整个造型充满艺术感,虽然略显诡异,却完美诠释了她前卫的时

上海这晚,『孙俪』和『马伊琍』衣品难评,全裹出镜的『宋佳』秒了全场(孙路上海)

抗体那么贵,保存不当全作废!(抗体是好的还是坏的?)

首选4℃冰袋运输:尽管-20℃是常用保存温度,但用干冰(-78.5℃)运输会导致抗体冻融一次。 参数设置:4℃、12000 rpm、3分钟(若体积<50μL,延长至5分钟)原因:运输颠簸使抗体液滴飞溅至管盖…

抗体那么贵,保存不当全作废!(抗体是好的还是坏的?)

湖南富豪离婚后又给女儿塞超7亿元 赠与协议终履行(富豪离婚案例)

9月16日晚,汇川技术发布公告称,9月8日至15日期间,公司实际控制人、董事长兼总裁朱兴明通过大宗交易方式向其女儿朱瀚玥转让了960.21万股公司股份。按公司披露的内部转让均价计算,此次转让的股份价值约7.70亿元

湖南富豪离婚后又给女儿塞超7亿元 赠与协议终履行(富豪离婚案例)