PC行业的NPU,起步其实比大家知道的更早
早在2023年9月21日,微软方面就发布了一款名为Surface Laptop Studio 2的可变形笔记本📓电脑💻️。从产品定位来说,它显然并不“大众”,但这款产品在整个PC史上注定会有一个特殊的地位,因为这是首款量产发布、带有NPU的“AI PC”。

当然大家都知道,直到三个月后,英特尔才会推出第一代内置NPU的Meteor Lake家族处理器。所以Surface Laptop Studio 2的NPU并非内置在处理器中,而是使用了一颗基于PCIE通道的“外挂”Movidius 3700VC方案,可提供大约7TOPs的AI算力。

我们手头也有一款使用Movidius方案的产品,只不过是更早的型号
不仅如此,“Movidius 3700VC”实际完全可以视为英特尔自家“NPU”的12nm雏形。因为之后Meteor Lake以及Arrow Lake里集成的“NPU3”,其内部型号正是“Movidius 3720”,基本就是前者的制程提升+超频版本。
jrhz.info
为什么英特尔要这么做?很显然,他们应该是希望实现旗下NPU的延续性,从而避免开发者面对这个“新玩意”一开始就被频繁更新、且互不兼容的架构给吓跑。但追求架构上的延续性,客观上却又制约了“NPU3”的算力上限。

于是乎,英特尔在Lunar Lake上推出了48TOPs的“NPU4”,在Panther Lake上则会将其更新到具有50TOPs算力的“NPU5”。根据目前的爆料信息,我们最快明年就会看到搭载74TOPs算力“NPU6”的NovaLake处理器面世。
NPU为什么不能普及?目前有两种主流观点
很显然,NPU的算力正在快速膨胀,但它是否已经实现了普及,并被普通消费者所接受了呢?
答案其实是否定的。一方面可以看到,在如今主流的桌面PC市场里,“不带NPU”的处理器依然占据了多数市场份额,譬如锐龙9 9950X3D、锐龙线程撕裂者、酷睿7 251E,以及至强W9、至强6这些或家用或专业向的高端处理器,它们甚至都并未内置NPU。

大家不喜欢『Windows』 Recall,本质上其实是“人性问题”
另一方面,即便是在那些内置高算力NPU的设备上,目前用户能够感受到的“好处”似乎也非常有限。比如在我们自己常用的一台“『骁龙』本”上,虽然NPU确实能用于摄像头虚化、实现麦克风降噪、辅助系统实时记录操作历史(『Windows』 Recall)。但除此之外,对于日常大量使用的第三方软件,NPU并不能起到什么“加速”作用。
为什么NPU从出现至今已经有两年多时间了,但始终没能真正普及、没能真正在大多数用户的“日常使用”中扮演重要角色呢?

其实前面举的这两个例子,就反映了目前行业中对于“NPU难以普及”的两种不同方向的观点。其中有一部分人认为,NPU的优势纯粹在于“高能效”,也就是说在处理AI任务时,NPU的速度本就不如高性能显卡,它们的优势仅仅在于低功耗,所以NPU就只适合笔记本📓电脑💻️这类供电、散热条件有限的设备,不应该出现在台式机上(即认为台式机有强大的CPU和独显,它的AI生态应该基于这两者去建设)。
而另一种观点则认为,NPU“现在不受宠”纯粹是因为算力还不够高,只要再迭代几次、算力高起来了,“大家就会愿意用它了”。
一款不常见的设备,扯下了NPU的“遮羞布”
事实上,此前我们三易生活也基本同意上面的两种想法,但直到近日我们看到了一款足以颠覆这些的产品。
这是一款笔记本📓电脑💻️,它的型号是戴尔Pro Max 16 Plus。那么它有什么特别的呢?简单来说,这款笔记本📓电脑💻️可以选配一块来自高通,型号为“AI-100 Ultra”的独立NPU卡。

根据产品信息显示,这个NPU卡会占用笔记本📓电脑💻️里的显卡安装位,它的功耗高达150W、自带128GB的LPDDR5X“显存”,并可在INT8格式下提供870TOPs的AI算力水平。
很显然,这并不是一个为“大众消费者”准备的配置。有相关报道显示,它更多瞄准的是AI开发者,以及那些需要在工厂之类非联网场景获得足够高端侧算力的用户。

但即便如此,这款“独立NPU”还是刷新了我们的认知。一方面它似乎表明,现阶段的常见NPU方案,比如那些处理器里集成、15到50TOPs算力的NPU,性能确实是太低,所以才没法在真正的专业级软件里得到支持。
但另一方面,其实深入这款“独立NPU”的参数就会发现,150W的功耗却“只能”提供870TOPs的算力,似乎也并没有特别大的优势。

打个比方来说,笔记本📓电脑💻️上的RTX5090同样是150W功耗,但AI算力可以达到912TOPs;而台式机上的RTX PRO6000显卡更是可以用600W功耗,实现最高4000TOPs的AI算力。也就是说如果我们真的要去计算“能效比”,那高性能独显的AI能效比,还真的不见得比大家现在看到的、各种集成在处理器里的“NPU”来得低。
当然,我们并不是说现代PC里的NPU就一定比独显更耗电,毕竟大多数集成式NPU本来就规模小、算力低,所以真去比较“绝对功耗”,当然就会得出集成式NPU较独立显卡省电的结论。

可相比于普通用户,开发者显然就没那么好糊弄。所以当一颗高功耗、能效也并不出色的“大NPU”,出现在专供开发者使用的电脑上时,实际上就已经构成了对当前“家用NPU”的嘲讽。它既让我们意识到目前的绝大多数NPU存在着绝对性能不足,所以无法真正被第三方软件所采纳。同时它的存在还表明,所谓“NPU效率高、NPU比显卡更省电”的说法,似乎也值得去重新审视。
【本文部分图片来自网络】




