大家记得不记得,在6月份的时候,任正非在受媒体采访时表示,华为的单芯片是落后英伟达一代的,但通过群计算补单芯片,用数学补物理、非摩尔补摩尔、群计算补单芯片,这样的话在结果上就能够补上来了。
这个意思,大家都懂的,那就是AI芯片上,其实并不是拼单颗芯片的算力的,可以多颗芯片一起上,一颗不行上2颗,上200颗,上2000颗,一样能够解决问题。
话里话外,任正非的意思就是,我们根本就不需要美国的AI芯片,华为一样可以满足大家的需求。
而近日,为了验证任正非的说法,华为在上海的世界人工智能大会上,真正拿出了昇腾384超节点,其实之前就有了,只是华为一直没有亮相出来。
而这次正式亮相,而这明显也就是之前任正非说的,用群计算补单芯片。
这个昇腾384超节点,由384颗昇腾910C芯片,以及192颗鲲鹏CPU用一种叫总线的技术紧密地连在了一起形成一个整体,这么多芯片集群后,算力能达到300 PFLOPs。
这个算力是什么概念,他已经达到了英伟达旗舰产品GB200 NVL72系统的两倍!
而英伟达这个系统,也是集群的,由72个Blackwell GPU与36个Grace CPU通过NVLink-C2C技术集成。
所以这就非常明显了,对于华为而言,也许单颗昇腾芯片,是比不过英特尔的GB200,并这无所谓啊,我可以通过多颗来集群,这样就不用担心了。
并且,华为的384节点的总内存容量,是英伟达方案的3.6倍,内存带宽也达到了2.1倍。
这样在进行AI计算时,有更快的速度,更强的算力,更大的容量,能处理更大的AI模型。
所以说,华为的AI芯片,其实不仅可以搞定中国市场需求,还能够搞定全球的需求,这也是为何美国要对华为AI芯片打压,最近又放开H20的原因。
而从这个方案来看,目前华为的AI芯片实力,真不比英伟达差,也许在单颗高端芯片上逊色一点点,但这并不重要,因为AI芯片几乎都不是靠单芯片比拼的,拼的都是集群。
所以说,任正非一向就是实事求是,不藏着掩着,也不吹牛,他承认单AI芯片性能不足,但也讲出了华为弥补的技术,并且这个技术是华为已经实现的,不是PPT,不是画饼。