为什么NPU难以普及？一款新产品扯下了“遮羞布” #科技 #Laptop #产品 #内置 #的设备 #Meteor

PC行业的NPU，起步其实比大家知道的更早

早在2023年9月21日，微软方面就发布了一款名为Surface Laptop Studio 2的可变形笔记本📓电脑💻️。从产品定位来说，它显然并不“大众”，但这款产品在整个PC史上注定会有一个特殊的地位，因为这是首款量产发布、带有NPU的“AI PC”。

今日霍州(www.jrhz.info)©️

当然大家都知道，直到三个月后，英特尔才会推出第一代内置NPU的Meteor Lake家族处理器。所以Surface Laptop Studio 2的NPU并非内置在处理器中，而是使用了一颗基于PCIE通道的“外挂”Movidius 3700VC方案，可提供大约7TOPs的AI算力。

今日霍州(www.jrhz.info)©️

我们手头也有一款使用Movidius方案的产品，只不过是更早的型号

不仅如此，“Movidius 3700VC”实际完全可以视为英特尔自家“NPU”的12nm雏形。因为之后Meteor Lake以及Arrow Lake里集成的“NPU3”，其内部型号正是“Movidius 3720”，基本就是前者的制程提升+超频版本。

jrhz.info

今日霍州(www.jrhz.info)©️

为什么英特尔要这么做？很显然，他们应该是希望实现旗下NPU的延续性，从而避免开发者面对这个“新玩意”一开始就被频繁更新、且互不兼容的架构给吓跑。但追求架构上的延续性，客观上却又制约了“NPU3”的算力上限。

今日霍州(www.jrhz.info)©️

于是乎，英特尔在Lunar Lake上推出了48TOPs的“NPU4”，在Panther Lake上则会将其更新到具有50TOPs算力的“NPU5”。根据目前的爆料信息，我们最快明年就会看到搭载74TOPs算力“NPU6”的NovaLake处理器面世。

NPU为什么不能普及？目前有两种主流观点

很显然，NPU的算力正在快速膨胀，但它是否已经实现了普及，并被普通消费者所接受了呢？

答案其实是否定的。一方面可以看到，在如今主流的桌面PC市场里，“不带NPU”的处理器依然占据了多数市场份额，譬如锐龙9 9950X3D、锐龙线程撕裂者、酷睿7 251E，以及至强W9、至强6这些或家用或专业向的高端处理器，它们甚至都并未内置NPU。

今日霍州(www.jrhz.info)©️

大家不喜欢『Windows』 Recall，本质上其实是“人性问题”

另一方面，即便是在那些内置高算力NPU的设备上，目前用户能够感受到的“好处”似乎也非常有限。比如在我们自己常用的一台“『骁龙』本”上，虽然NPU确实能用于摄像头虚化、实现麦克风降噪、辅助系统实时记录操作历史（『Windows』 Recall）。但除此之外，对于日常大量使用的第三方软件，NPU并不能起到什么“加速”作用。

为什么NPU从出现至今已经有两年多时间了，但始终没能真正普及、没能真正在大多数用户的“日常使用”中扮演重要角色呢？

今日霍州(www.jrhz.info)©️

其实前面举的这两个例子，就反映了目前行业中对于“NPU难以普及”的两种不同方向的观点。其中有一部分人认为，NPU的优势纯粹在于“高能效”，也就是说在处理AI任务时，NPU的速度本就不如高性能显卡，它们的优势仅仅在于低功耗，所以NPU就只适合笔记本📓电脑💻️这类供电、散热条件有限的设备，不应该出现在台式机上（即认为台式机有强大的CPU和独显，它的AI生态应该基于这两者去建设）。

而另一种观点则认为，NPU“现在不受宠”纯粹是因为算力还不够高，只要再迭代几次、算力高起来了，“大家就会愿意用它了”。

一款不常见的设备，扯下了NPU的“遮羞布”

事实上，此前我们三易生活也基本同意上面的两种想法，但直到近日我们看到了一款足以颠覆这些的产品。

这是一款笔记本📓电脑💻️，它的型号是戴尔Pro Max 16 Plus。那么它有什么特别的呢？简单来说，这款笔记本📓电脑💻️可以选配一块来自高通，型号为“AI-100 Ultra”的独立NPU卡。

根据产品信息显示，这个NPU卡会占用笔记本📓电脑💻️里的显卡安装位，它的功耗高达150W、自带128GB的LPDDR5X“显存”，并可在INT8格式下提供870TOPs的AI算力水平。

很显然，这并不是一个为“大众消费者”准备的配置。有相关报道显示，它更多瞄准的是AI开发者，以及那些需要在工厂之类非联网场景获得足够高端侧算力的用户。

但即便如此，这款“独立NPU”还是刷新了我们的认知。一方面它似乎表明，现阶段的常见NPU方案，比如那些处理器里集成、15到50TOPs算力的NPU，性能确实是太低，所以才没法在真正的专业级软件里得到支持。

但另一方面，其实深入这款“独立NPU”的参数就会发现，150W的功耗却“只能”提供870TOPs的算力，似乎也并没有特别大的优势。

打个比方来说，笔记本📓电脑💻️上的RTX5090同样是150W功耗，但AI算力可以达到912TOPs；而台式机上的RTX PRO6000显卡更是可以用600W功耗，实现最高4000TOPs的AI算力。也就是说如果我们真的要去计算“能效比”，那高性能独显的AI能效比，还真的不见得比大家现在看到的、各种集成在处理器里的“NPU”来得低。

当然，我们并不是说现代PC里的NPU就一定比独显更耗电，毕竟大多数集成式NPU本来就规模小、算力低，所以真去比较“绝对功耗”，当然就会得出集成式NPU较独立显卡省电的结论。

可相比于普通用户，开发者显然就没那么好糊弄。所以当一颗高功耗、能效也并不出色的“大NPU”，出现在专供开发者使用的电脑上时，实际上就已经构成了对当前“家用NPU”的嘲讽。它既让我们意识到目前的绝大多数NPU存在着绝对性能不足，所以无法真正被第三方软件所采纳。同时它的存在还表明，所谓“NPU效率高、NPU比显卡更省电”的说法，似乎也值得去重新审视。

【本文部分图片来自网络】