尽管遭遇重重挑战,但在“Make Intel Great Again”的目标牵引下,英特尔正重新踏上复兴之路。
新CEO治下的蓝色巨人,内部经历大刀阔斧的变革,外部展现合纵连横的开放。而即将在今年Q4量产的Inte 18A,则成为其在产品和技术创新侧的奋力一搏。
日前,英特尔在美国亚利桑那举行的“Tech Tour ”活动上,宣布推出由Intel 18A工艺打造,代号“Pather Lake”的新一代AI PC『芯片』架构。
Intel 18A代表着当前集成电路领域先进工艺和晶圆制造水平的天花板,作为全球首个利用Ribbon FET和背部供电的工艺节点下的首款产品,Panther Lake凭借性能、能效、AI能力等方面的全方位提升,推动AI PC体验的重塑,而英特尔也借此“秀出肌肉、击碎质疑”,引领晶圆制造进入全新时代。
灵活可扩展:Panther Lake的架构雄心
Panther Lake继承了前两代Lunar Lake和Arrow Lake在架构方面的创新,以及所带来的能效和性能上的表现,英特尔为Panther Lake在架构设计上赋予了极大的灵活度。
Fabric Gen2是英特尔在Lunar lake上推出的新一代片内部互联技术,主要用于连接计算模块(Compute Tile)与平台控制模块(Platform Controller Tile),以及模块内部各功能单元(如 CPU、GPU、NPU),其核心目标是在低功耗与高效通信之间取得平衡。
同时,通过统一的可扩展协议,Fabric Gen2可以CPU、GPU、NPU等核心IP模块无需与制造和封装工艺绑定,而是可以根据需求实现“混搭”,从而突破单一制程和IP体系的限制,这极大增强了架构上的可扩展性和灵活度。
Panther Lake继承了Arrow Lake上独立GPU模块的设计思路(Lunar中GPU位于计算模块中),计算模块与GPU模块通过D2D连接,这为GPU的Xe内核的更新以及数量增加提供便利,也有利于未来实现跨厂商的GPU IP模块集成。
Panther Lake的架构包括计算(集成主要的计算引擎)、GPU、Base、Filler、平台控制(所有I/O接口IP)、Foveros(Foveros 2.5D封装)和Package等主要的模块。
在存储方面,采用板载内存的形式,Panther Lake支持LPDDR5X最高9600MT/s以及最高96GB的容量,DDR5最高支持7200MT/s以及最高128GB的容量。
在封装技术方面,Foveros-S(2.5D封装)是英特尔目前在Meteor Lake、Arrow Lake和Panther Lake等产品中正在使用的技术。所有产品均采用同一封装形式,也便于客户进行产品设计。
整体而言,Panther Lake在架构上的灵活性,为平台设计提供更多选择。这有助于Panther Lake作为一个长周期节点(至少三代产品,英特尔预计在2030年达到产能和需求的高点)在后续演进上的迭代,为OEM推出跨越不同价格段的产品在设计上预留足够空间。此外,这种灵活的设计方式也有助于同更加开放的英特尔代工战略协同,吸引外部客户参与其代工生态。这也是为何英特尔对于Panther Lake强调“架构雄心”的意义所在。
在Panther Lake的计算模块,采用的Intel 18A工艺,而对于其他模块则采用外部工艺、Intel3等,对此,英特尔公司客户端计算事业部副总裁兼中国区总经理高嵩解释称,在选择制程时,会权衡价格、实现时间、团队具体安排等多种因素,英特尔会根据产品需求,灵活选择代工服务和制程。
Intel 18A:达到量产良率
英特尔18A工艺(1.8 纳米级)作为其IDM 2.0战略的核心技术突破,不仅承载着英特尔重返技术领先地位的厚望,更有望通过技术创新和战略布局重塑全球『半导体』竞争格局。
Intel 18A是全球首个利用Ribbon FET和背部供电的工艺节点。
RibbonFET 全环绕栅极(GAA)技术实现了晶体管架构的颠覆式创新。通过垂直堆叠的纳米带(Nanoribbons)结构,Ribbon FET实现三维电流控制,相比传统 FinFET,门电路控制能力更加优秀,驱动电流增强20%,开关速度提升15%,漏电率降低30%。这种设计使晶体管尺寸进一步微缩至1.8 纳米级,『芯片』密度较Intel 3工艺提升30%,能效比提升15%。同时,对于『芯片』设计而言也更具灵活性和扩展性。
Intel 18A的背部供电技术,则是业界首个将供电网络完全转移至『芯片』背面的量产方案。实现了超过10%的『芯片』密度提升,同时使封装到晶体管的IR drop(压降)减少30%,带来更好的能耗表现。同时,Intel 18A通过集成背部供电技术,带来了更优秀的成本控制。同intel3相比,在EUV光刻过程中,可以使光罩数量减少44%,步骤减少42%。
得益于Ribbon FET和背部供电技术,Intel 18A相比于Intel3,每瓦性能提升15%,『芯片』集成度提升1.3倍,功耗降低25%。
对于Intel 18A的良率一直是外界关心的话题,在此次活动上,英特尔也对此进行了回应。按照英特尔的说法,Intel 18A的良率接近甚至超过过去15年的关键技术节点,已达到量产良率水平。10月9日,英特尔亚利桑那州的FAB52工厂将实现满载运营,Panther Lake今年Q4也将实现量产。
针对不同类型『芯片』设计要求,英特尔选用不同封装技术组合,其中包括EMIB、Foveros and Foveros Direct等。
Foveros属于灵活的的chiplet封装技术,能够适应不同产品需求变化。针对不同『芯片』面积和设计周期能够灵活拓展。Panther Lake采用的是Foveros-S,经过多年发展,更加成熟,此次Panther Lake系列的所有产品均采用同一封装形式,便于客户进行产品设计。
三箭齐发:GPU性能大涨50%
Panther Lake通过采用新的核IP。包括代号为Cougar Cove的P核和代号为Darkmont的E核和LPE核,均为18A特别设计和优化,能够以低功耗实现高性能,同时也对IPC进行了额外的优化。
此次推出的Panther Lake系列包括三款不同的配置,其中8核、16核版本最高支持4核Xe GPU,而16核(12Xe)版本最高支持12个Xe核。
从目前配置策略看,8核版本应为面向普通商用市场,16核(4核Xe GPU)版则面向企业级市场,同时,该版本也能够支持独显;而16核(12核Xe GPU)则面向游戏、高性能轻薄本等市场。
全新的Xe3 GPU是Panther Lake的一大亮点,Panther Lake最多支持12个Xe3核心,最大16MB的L2缓存,最多12个光追单元以及120TOPS的算力。
Xe3相较于Lunar Lake的性能表现提升了50%,相较于Arrow Lake H的每瓦性能高出40%。此前英特尔在Tiger Lake、Meteor Lake等代际产品中,也实现过GPU的性能显著升级,但像Xe3这样达到50%的巨幅提升是近年来罕见的。
相较于一般的CPU选型“高U低显”或“高显低U”的配置,16核(12核Xe GPU)版本将CPU和GPU的配置拉满。对此,高嵩表示,16核(12核Xe GPU)是此次的一个亮点,提供了全新的配置选项,在实际核心的配置上,英特尔的策略是希望坚持CPU和GPU双强并进,已提供卓越的性能体验,力求达到最佳的平衡表现。
高嵩指出,在当前很多支持AI应用方面,有超过一半的AI负载跑在GPU上,20%左右跑在NPU上,10%跑在CPU上,通过12Xe可以支持更多的内容创作工作,而如果是游戏场景,也有NPU和GPU做支持。
“例如我们跟逗逗、新智慧芯做的游戏助手,是将多的算法放到了NPU上,然后让GPU接着去跑游戏。尽管异构硬件架构并非英特尔独有,但目前只有我们通过深度的软件优化,真正实现了CPU、GPU、NPU的协同增效。”高嵩说。
XPU协同:180TOPS算力应对AI挑战
Panther Lake集成了全新的NPU5,架构目标是面积效率以及为最新的负载优化。
相较Lunar Lake,Panther Lake的NPU5算力密度提升超过40%,最高50TOPS算力,相较于Arrow Laker-H算力提高3.8倍。在量化方面,Panther Lake实现原生支持FP8,使其对『大语言模型』的支持更好。值得一提的是,NPU5在面积上实现的显著缩小,对降低制造成本和集成度具有重要意义。
在AI能力上,Panther Lake平台总共拥有180TOPS的算力,CPU、NPU、GPU三个AI加速器分别拥有10TOPS、50TOPS、120TOPS,以用于不同的工作负载。
目前,行业对于AI性能的评测集中在模型参数。英特尔中国区技术部总经理高宇指出,Panther Lake能够支持70B的模型,但30B的MOE的模型,才是既有智能表现又有良好用户体验的选择。而这正是英特尔Panther Lake,包括Arrow Lake所能支持的最佳甜蜜点。在提供了如此大的显存后,除了能够运行30B的MOE模型,还能支持非常长的上下文处理。
“在进行AI性能评测时,应该将重点放在这些实际的用户体验和创新应用上,而不是仅仅追求能够运行多大的模型,因为那样跟实际意义是有一定差距的。”高宇说。
高宇表示,英特尔坚持深耕XPU的路线,强调CPU、GPU、NPU的协同。CPU擅长快速响应,适合处理语音转文字等应用,GPU因为有足够的吞吐量和带宽支持,适合高并发和高带宽需求的应用,而NPU因为能效比很高,适合追求能效的应用。
在IPU方面,全新的IPU7.5在图像处理上带来了显著升级。新增的Staggered HDR功能,能够实现硬件加速、双重曝光、自适应曝光控制、AI光学降噪等创新功能,能够大幅改进暗光场景下的图片和视频质量。
英特尔在AI图像应用方面一直走在前沿,例如AI局部调色等创新功能,都有着出色成果。之所以非常重视前置摄像头的能力,在于ISP与AI应用有着密不可分的关系。
“摄像头作为重要的传感器,与AI结合之后,能够极大拓展应用边界。合作伙伴也提出针对于会议场景的摄像头智能记录,甚至捕捉参会人员实时反应的需求。此外,对于习惯用纸笔记录会议摘要的用户,一个结合AI技术的高性能摄像头,能够将手写内容转化为可编辑的电子文档等。因此,对于IPU的提升将显著增强包括视频会议和通话在内的使用体验,解锁更多AI应用的可能性。”高嵩说。
而对于提升IPU能力所可能造成的成本挑战。高宇解释称,PC上通常配置的摄像头像素范围在500万到1300万之间,远未达到4800万像素级别,因此摄像头本身的硬件成本可控。关键在于,即使是相同的摄像头硬件,通过英特尔IPU的驱动和优化,其整体成像效果将远超采用外挂USB驱动的方案。
在多媒体显示方面,XeMedia Engine支持广泛的编解码,包括最新的AVC、AC1、XAVC-H等,据了解,该项技术的创新主要由中国团队完成。
连接不妥协:支持Wi-Fi 7(R2)
在连接方面,Panther Lake采用的是业界领先的Wi-Fi 7(R2)。因为Wi-Fi 7标准本身比较灵活,目前很多Wi-Fi 7技术只使用了R1版本中的部分特性,而英特尔在支持Wi-Fi标准时,是按照最严格的要求来支持,这也带来了更快的速度,更高的稳定性和安全性,这一点特别对于企业级用户而言非常重要。
Panther Lake支持蓝牙6,特别是其Auracast功能。Auracast允许用户的耳机在不干扰他人的情况下,共享同一音频源,同时,也能够实现对于低功耗蓝牙(LE Audio)的支持,显著降低设备功耗。
在有线连接方面,Panther Lake配备了三个Thunderbolt端口,Thunderbolt 5需要独立的『芯片』,而Thunderbolt 4则已集成到主控中。
毫无疑问,上述在连接方面的更强性能,对于AI PC而言将显著优化用户体验。
领先能效:CPU多线程功耗降低30%
除了领先的性能外,Panther Lake在一系列创新技术的加持下,所表现出的极致能效也令人印象深刻。
LPE核心首次在Meteor Lake中引入,并仅在酷睿Ultra高端型号中率先集成,并在后续的Lunar Lake和Arrow Lake中被使用。
在Panther Lake中,采用了4个LPE核,这可能反映出LPE核心性能上的提升,以及英特尔在管理和调度上的成熟和完善。
比如针对一些负载任务,同早期Arrow Lake和Raptor Lake先从P核开始,再根据负载转移的调度策略不同,自Meteor Lake和Lunar Lake开始,英特尔转向LPE核优先。
在Lunar Lake上,任务将优先在LPE核高效执行,如果LPE核能够处理,任务会迅速完成;如果需要更高性能,系统会智能地拉起四个P核和四个E核协同工作,待任务完成后再返回LPE核,以实现能效最大化。面对更重负载,所有核心将全面启动,以提供最强性能。
这种情况,在DC(直流供电,即电池供电)模式将非常明显,在此模式下,系统认为续航优先,会积极地将资源配置为效率区(efficiency zone)模式,并尽可能地将工作负载优先分配给LPE核,以最大限度地延长电池使用时间。
以B站重弹幕视频播放为例,任务首先在LPE核运行,遇到重负载时P核介入,负载降低后再返回LPE核。另一个案例是Teams应用,这是一个轻负载,在Lunar Lake上,通过『Windows』 WPA工具分析可以看到,负载基本上都在LPE侧,P核的线程调度上只有零星部分,大概在几十或者是几百微秒。
此外,为了更好地获得时延、带宽和能效表现,Panther Lake还采用Memory side cache(内存侧缓存)技术(8MB物理缓存),这是能效提升的另一个重要原因。
简要而言,内存侧缓存技术就是把数据缓存放到离处理器更近的地方,减少DRAM拥堵和功耗,使数据被抓取成功的概率更高,传输距离更短,缩短延迟提升带宽。这项技术也是在目前『Windows』 PC领域英特尔的独家技术。
除了硬件层面外,在软件方面,Panther Lake采用了进一步优化的硬件线程调度器,其扮演着连接操作系统和硬件之间的桥梁角色,能够根据实时监控到的指令集,对CPU上的所有线程进行分类,上报给操作系统,结合OS控制区的切换,会将不同工作负载放在不同的核心,在办公、游戏、加电或者不插电等场景下,对应算法不同。
这和前几代产品中的调度逻辑有显著区别,这种优化实际上体现了Intel对软件硬件一体持续优化的考量,核心目标则是确保更合适的负载能够被调度到更适合的核心上运行,从而保证最佳的能效和性能。
而在电源管理技术方面,通过在DTT中加入API,Panther Lake允许OEM厂商根据自身的产品定位和用户需求,灵活地选择工作负载的调度策略,为OEM提供更大自主权,能够根据具体场景,决定优先保障能效或追求极致性能,从而打造出更具差异化产品。
得益于内存侧缓存、硬件线程调度器、电源管理等技术创新,Panther Lake继承了Lunar Lake在能效上的优势,同时,凭借在此基础上的8个E核的加持,Panther Lake跟Arrow Lake相比不仅能效更高,还实现了性能的显著提升。
和Lunar Lake相比,Panther Lake CPU在相同功耗下的单线程性能提升超过10%。
和Lunar Lake以及Arrow Lake相比,CPU在相同功耗情况下,多线程能力提升超过50%。
和Arrow Lake相比,CPU在相同多线程性能的同时功耗降低30%。
和Lunar Lake以及Arrow Lake相比,GPU的性能表现提升50%。
同Lunar Lake相比,NPU算力密度提升超过40%,IPU功耗降低1.5W。
同Lunar Lake相比,SoC的能耗提升10%;同Arrow Lake相比,SoC具有40%的能耗降低。
结语
Panther Lake作为英特尔18A工艺的首发产品,是其技术复兴与IDM 2.0战略落地的关键载体。依托 Ribbon FET与背部供电技术,以及多项革命性的创新技术,将性能与能效的优化带到新高度,精准匹配了新时代下AI PC的需求。同时,其架构上的灵活可扩展性的理念,也展现出英特尔更加开放,注重客户意见和用户体验的全新姿态。
Panther Lake验证了Intel 18A工艺的量产能力,击碎外界对其技术滞后的质疑,重新定义了AI PC体验。Panther Lake的量产不仅是英特尔重夺市场优势的希望,也引领着全球『半导体』进入 “先进制程+异构协同” 的新纪元。