英特尔18A首秀！Panther Lake重塑AI PC体验：CPUGPU性能暴涨50%！(英特尔18核) #科技 #架构 #Panther #产品 #技术 #『芯片』

尽管遭遇重重挑战，但在“Make Intel Great Again”的目标牵引下，英特尔正重新踏上复兴之路。

新CEO治下的蓝色巨人，内部经历大刀阔斧的变革，外部展现合纵连横的开放。而即将在今年Q4量产的Inte 18A，则成为其在产品和技术创新侧的奋力一搏。

日前，英特尔在美国亚利桑那举行的“Tech Tour ”活动上，宣布推出由Intel 18A工艺打造，代号“Pather Lake”的新一代AI PC『芯片』架构。

Intel 18A代表着当前集成电路领域先进工艺和晶圆制造水平的天花板，作为全球首个利用Ribbon FET和背部供电的工艺节点下的首款产品，Panther Lake凭借性能、能效、AI能力等方面的全方位提升，推动AI PC体验的重塑，而英特尔也借此“秀出肌肉、击碎质疑”，引领晶圆制造进入全新时代。

灵活可扩展：Panther Lake的架构雄心

Panther Lake继承了前两代Lunar Lake和Arrow Lake在架构方面的创新，以及所带来的能效和性能上的表现，英特尔为Panther Lake在架构设计上赋予了极大的灵活度。

Fabric Gen2是英特尔在Lunar lake上推出的新一代片内部互联技术，主要用于连接计算模块（Compute Tile）与平台控制模块（Platform Controller Tile），以及模块内部各功能单元（如 CPU、GPU、NPU），其核心目标是在低功耗与高效通信之间取得平衡。

同时，通过统一的可扩展协议，Fabric Gen2可以CPU、GPU、NPU等核心IP模块无需与制造和封装工艺绑定，而是可以根据需求实现“混搭”，从而突破单一制程和IP体系的限制，这极大增强了架构上的可扩展性和灵活度。

Panther Lake继承了Arrow Lake上独立GPU模块的设计思路（Lunar中GPU位于计算模块中），计算模块与GPU模块通过D2D连接，这为GPU的Xe内核的更新以及数量增加提供便利，也有利于未来实现跨厂商的GPU IP模块集成。

Panther Lake的架构包括计算（集成主要的计算引擎）、GPU、Base、Filler、平台控制（所有I/O接口IP）、Foveros（Foveros 2.5D封装）和Package等主要的模块。

在存储方面，采用板载内存的形式，Panther Lake支持LPDDR5X最高9600MT/s以及最高96GB的容量，DDR5最高支持7200MT/s以及最高128GB的容量。

在封装技术方面，Foveros-S（2.5D封装）是英特尔目前在Meteor Lake、Arrow Lake和Panther Lake等产品中正在使用的技术。所有产品均采用同一封装形式，也便于客户进行产品设计。

整体而言，Panther Lake在架构上的灵活性，为平台设计提供更多选择。这有助于Panther Lake作为一个长周期节点（至少三代产品，英特尔预计在2030年达到产能和需求的高点）在后续演进上的迭代，为OEM推出跨越不同价格段的产品在设计上预留足够空间。此外，这种灵活的设计方式也有助于同更加开放的英特尔代工战略协同，吸引外部客户参与其代工生态。这也是为何英特尔对于Panther Lake强调“架构雄心”的意义所在。

在Panther Lake的计算模块，采用的Intel 18A工艺，而对于其他模块则采用外部工艺、Intel3等，对此，英特尔公司客户端计算事业部副总裁兼中国区总经理高嵩解释称，在选择制程时，会权衡价格、实现时间、团队具体安排等多种因素，英特尔会根据产品需求，灵活选择代工服务和制程。

Intel 18A：达到量产良率

英特尔18A工艺（1.8 纳米级）作为其IDM 2.0战略的核心技术突破，不仅承载着英特尔重返技术领先地位的厚望，更有望通过技术创新和战略布局重塑全球『半导体』竞争格局。

Intel 18A是全球首个利用Ribbon FET和背部供电的工艺节点。

RibbonFET 全环绕栅极（GAA）技术实现了晶体管架构的颠覆式创新。通过垂直堆叠的纳米带（Nanoribbons）结构，Ribbon FET实现三维电流控制，相比传统 FinFET，门电路控制能力更加优秀，驱动电流增强20%，开关速度提升15%，漏电率降低30%。这种设计使晶体管尺寸进一步微缩至1.8 纳米级，『芯片』密度较Intel 3工艺提升30%，能效比提升15%。同时，对于『芯片』设计而言也更具灵活性和扩展性。

Intel 18A的背部供电技术，则是业界首个将供电网络完全转移至『芯片』背面的量产方案。实现了超过10%的『芯片』密度提升，同时使封装到晶体管的IR drop（压降）减少30%，带来更好的能耗表现。同时，Intel 18A通过集成背部供电技术，带来了更优秀的成本控制。同intel3相比，在EUV光刻过程中，可以使光罩数量减少44%，步骤减少42%。

得益于Ribbon FET和背部供电技术，Intel 18A相比于Intel3，每瓦性能提升15%，『芯片』集成度提升1.3倍，功耗降低25%。

对于Intel 18A的良率一直是外界关心的话题，在此次活动上，英特尔也对此进行了回应。按照英特尔的说法，Intel 18A的良率接近甚至超过过去15年的关键技术节点，已达到量产良率水平。10月9日，英特尔亚利桑那州的FAB52工厂将实现满载运营，Panther Lake今年Q4也将实现量产。

针对不同类型『芯片』设计要求，英特尔选用不同封装技术组合，其中包括EMIB、Foveros and Foveros Direct等。

Foveros属于灵活的的chiplet封装技术，能够适应不同产品需求变化。针对不同『芯片』面积和设计周期能够灵活拓展。Panther Lake采用的是Foveros-S，经过多年发展，更加成熟，此次Panther Lake系列的所有产品均采用同一封装形式，便于客户进行产品设计。

三箭齐发：GPU性能大涨50%

Panther Lake通过采用新的核IP。包括代号为Cougar Cove的P核和代号为Darkmont的E核和LPE核，均为18A特别设计和优化，能够以低功耗实现高性能，同时也对IPC进行了额外的优化。

此次推出的Panther Lake系列包括三款不同的配置，其中8核、16核版本最高支持4核Xe GPU，而16核（12Xe）版本最高支持12个Xe核。

从目前配置策略看，8核版本应为面向普通商用市场，16核（4核Xe GPU）版则面向企业级市场，同时，该版本也能够支持独显；而16核（12核Xe GPU）则面向游戏、高性能轻薄本等市场。

全新的Xe3 GPU是Panther Lake的一大亮点，Panther Lake最多支持12个Xe3核心，最大16MB的L2缓存，最多12个光追单元以及120TOPS的算力。

Xe3相较于Lunar Lake的性能表现提升了50%，相较于Arrow Lake H的每瓦性能高出40%。此前英特尔在Tiger Lake、Meteor Lake等代际产品中，也实现过GPU的性能显著升级，但像Xe3这样达到50%的巨幅提升是近年来罕见的。

相较于一般的CPU选型“高U低显”或“高显低U”的配置，16核（12核Xe GPU）版本将CPU和GPU的配置拉满。对此，高嵩表示，16核（12核Xe GPU）是此次的一个亮点，提供了全新的配置选项，在实际核心的配置上，英特尔的策略是希望坚持CPU和GPU双强并进，已提供卓越的性能体验，力求达到最佳的平衡表现。

高嵩指出，在当前很多支持AI应用方面，有超过一半的AI负载跑在GPU上，20%左右跑在NPU上，10%跑在CPU上，通过12Xe可以支持更多的内容创作工作，而如果是游戏场景，也有NPU和GPU做支持。

“例如我们跟逗逗、新智慧芯做的游戏助手，是将多的算法放到了NPU上，然后让GPU接着去跑游戏。尽管异构硬件架构并非英特尔独有，但目前只有我们通过深度的软件优化，真正实现了CPU、GPU、NPU的协同增效。”高嵩说。

XPU协同：180TOPS算力应对AI挑战

Panther Lake集成了全新的NPU5，架构目标是面积效率以及为最新的负载优化。

相较Lunar Lake，Panther Lake的NPU5算力密度提升超过40%，最高50TOPS算力，相较于Arrow Laker-H算力提高3.8倍。在量化方面，Panther Lake实现原生支持FP8，使其对『大语言模型』的支持更好。值得一提的是，NPU5在面积上实现的显著缩小，对降低制造成本和集成度具有重要意义。

在AI能力上，Panther Lake平台总共拥有180TOPS的算力，CPU、NPU、GPU三个AI加速器分别拥有10TOPS、50TOPS、120TOPS，以用于不同的工作负载。

目前，行业对于AI性能的评测集中在模型参数。英特尔中国区技术部总经理高宇指出，Panther Lake能够支持70B的模型，但30B的MOE的模型，才是既有智能表现又有良好用户体验的选择。而这正是英特尔Panther Lake，包括Arrow Lake所能支持的最佳甜蜜点。在提供了如此大的显存后，除了能够运行30B的MOE模型，还能支持非常长的上下文处理。

“在进行AI性能评测时，应该将重点放在这些实际的用户体验和创新应用上，而不是仅仅追求能够运行多大的模型，因为那样跟实际意义是有一定差距的。”高宇说。

高宇表示，英特尔坚持深耕XPU的路线，强调CPU、GPU、NPU的协同。CPU擅长快速响应，适合处理语音转文字等应用，GPU因为有足够的吞吐量和带宽支持，适合高并发和高带宽需求的应用，而NPU因为能效比很高，适合追求能效的应用。

在IPU方面，全新的IPU7.5在图像处理上带来了显著升级。新增的Staggered HDR功能，能够实现硬件加速、双重曝光、自适应曝光控制、AI光学降噪等创新功能，能够大幅改进暗光场景下的图片和视频质量。

英特尔在AI图像应用方面一直走在前沿，例如AI局部调色等创新功能，都有着出色成果。之所以非常重视前置摄像头的能力，在于ISP与AI应用有着密不可分的关系。

“摄像头作为重要的传感器，与AI结合之后，能够极大拓展应用边界。合作伙伴也提出针对于会议场景的摄像头智能记录，甚至捕捉参会人员实时反应的需求。此外，对于习惯用纸笔记录会议摘要的用户，一个结合AI技术的高性能摄像头，能够将手写内容转化为可编辑的电子文档等。因此，对于IPU的提升将显著增强包括视频会议和通话在内的使用体验，解锁更多AI应用的可能性。”高嵩说。

而对于提升IPU能力所可能造成的成本挑战。高宇解释称，PC上通常配置的摄像头像素范围在500万到1300万之间，远未达到4800万像素级别，因此摄像头本身的硬件成本可控。关键在于，即使是相同的摄像头硬件，通过英特尔IPU的驱动和优化，其整体成像效果将远超采用外挂USB驱动的方案。

在多媒体显示方面，XeMedia Engine支持广泛的编解码，包括最新的AVC、AC1、XAVC-H等，据了解，该项技术的创新主要由中国团队完成。

连接不妥协：支持Wi-Fi 7（R2）

在连接方面，Panther Lake采用的是业界领先的Wi-Fi 7（R2）。因为Wi-Fi 7标准本身比较灵活，目前很多Wi-Fi 7技术只使用了R1版本中的部分特性，而英特尔在支持Wi-Fi标准时，是按照最严格的要求来支持，这也带来了更快的速度，更高的稳定性和安全性，这一点特别对于企业级用户而言非常重要。

Panther Lake支持蓝牙6，特别是其Auracast功能。Auracast允许用户的耳机在不干扰他人的情况下，共享同一音频源，同时，也能够实现对于低功耗蓝牙（LE Audio）的支持，显著降低设备功耗。

在有线连接方面，Panther Lake配备了三个Thunderbolt端口，Thunderbolt 5需要独立的『芯片』，而Thunderbolt 4则已集成到主控中。

毫无疑问，上述在连接方面的更强性能，对于AI PC而言将显著优化用户体验。

领先能效：CPU多线程功耗降低30%

除了领先的性能外，Panther Lake在一系列创新技术的加持下，所表现出的极致能效也令人印象深刻。

LPE核心首次在Meteor Lake中引入，并仅在酷睿Ultra高端型号中率先集成，并在后续的Lunar Lake和Arrow Lake中被使用。

在Panther Lake中，采用了4个LPE核，这可能反映出LPE核心性能上的提升，以及英特尔在管理和调度上的成熟和完善。

比如针对一些负载任务，同早期Arrow Lake和Raptor Lake先从P核开始，再根据负载转移的调度策略不同，自Meteor Lake和Lunar Lake开始，英特尔转向LPE核优先。

在Lunar Lake上，任务将优先在LPE核高效执行，如果LPE核能够处理，任务会迅速完成；如果需要更高性能，系统会智能地拉起四个P核和四个E核协同工作，待任务完成后再返回LPE核，以实现能效最大化。面对更重负载，所有核心将全面启动，以提供最强性能。

这种情况，在DC（直流供电，即电池供电）模式将非常明显，在此模式下，系统认为续航优先，会积极地将资源配置为效率区（efficiency zone）模式，并尽可能地将工作负载优先分配给LPE核，以最大限度地延长电池使用时间。

以B站重弹幕视频播放为例，任务首先在LPE核运行，遇到重负载时P核介入，负载降低后再返回LPE核。另一个案例是Teams应用，这是一个轻负载，在Lunar Lake上，通过『Windows』 WPA工具分析可以看到，负载基本上都在LPE侧，P核的线程调度上只有零星部分，大概在几十或者是几百微秒。

此外，为了更好地获得时延、带宽和能效表现，Panther Lake还采用Memory side cache（内存侧缓存）技术（8MB物理缓存），这是能效提升的另一个重要原因。

简要而言，内存侧缓存技术就是把数据缓存放到离处理器更近的地方，减少DRAM拥堵和功耗，使数据被抓取成功的概率更高，传输距离更短，缩短延迟提升带宽。这项技术也是在目前『Windows』 PC领域英特尔的独家技术。

除了硬件层面外，在软件方面，Panther Lake采用了进一步优化的硬件线程调度器，其扮演着连接操作系统和硬件之间的桥梁角色，能够根据实时监控到的指令集，对CPU上的所有线程进行分类，上报给操作系统，结合OS控制区的切换，会将不同工作负载放在不同的核心，在办公、游戏、加电或者不插电等场景下，对应算法不同。

这和前几代产品中的调度逻辑有显著区别，这种优化实际上体现了Intel对软件硬件一体持续优化的考量，核心目标则是确保更合适的负载能够被调度到更适合的核心上运行，从而保证最佳的能效和性能。

而在电源管理技术方面，通过在DTT中加入API，Panther Lake允许OEM厂商根据自身的产品定位和用户需求，灵活地选择工作负载的调度策略，为OEM提供更大自主权，能够根据具体场景，决定优先保障能效或追求极致性能，从而打造出更具差异化产品。

得益于内存侧缓存、硬件线程调度器、电源管理等技术创新，Panther Lake继承了Lunar Lake在能效上的优势，同时，凭借在此基础上的8个E核的加持，Panther Lake跟Arrow Lake相比不仅能效更高，还实现了性能的显著提升。

和Lunar Lake相比，Panther Lake CPU在相同功耗下的单线程性能提升超过10%。

和Lunar Lake以及Arrow Lake相比，CPU在相同功耗情况下，多线程能力提升超过50%。

和Arrow Lake相比，CPU在相同多线程性能的同时功耗降低30%。

和Lunar Lake以及Arrow Lake相比，GPU的性能表现提升50%。

同Lunar Lake相比，NPU算力密度提升超过40%，IPU功耗降低1.5W。

同Lunar Lake相比，SoC的能耗提升10%；同Arrow Lake相比，SoC具有40%的能耗降低。

结语

Panther Lake作为英特尔18A工艺的首发产品，是其技术复兴与IDM 2.0战略落地的关键载体。依托 Ribbon FET与背部供电技术，以及多项革命性的创新技术，将性能与能效的优化带到新高度，精准匹配了新时代下AI PC的需求。同时，其架构上的灵活可扩展性的理念，也展现出英特尔更加开放，注重客户意见和用户体验的全新姿态。

Panther Lake验证了Intel 18A工艺的量产能力，击碎外界对其技术滞后的质疑，重新定义了AI PC体验。Panther Lake的量产不仅是英特尔重夺市场优势的希望，也引领着全球『半导体』进入 “先进制程+异构协同” 的新纪元。