HBM,十年预告

HBM,十年预告

本文由『半导体』产业纵横(ID:ICVIEWS)综合

HBM,未来已来。

HBM利用 3D 堆叠的 DRAM 架构,提供卓越的数据带宽和效率。与依赖更宽总线和更高时钟速度的传统内存模块不同,HBM 将多个内存『芯片』垂直堆叠,并与处理器紧密集成。这种方法显著拓宽了通信接口,同时降低了延迟和功耗。HBM 由 JEDEC 标准化,最初由三星、AMD 和 SK 海力士共同开发,并于 2015 年首次在 AMD 的 Fiji GPU 中实现商用。自那时起,HBM 已成为高性能应用的关键推动者,包括 GPU、AI 加速器、网络设备,甚至需要高带宽缓存或主内存的 CPU。

HBM 的兴起源于“内存墙”这一持续存在的挑战——处理器速度与内存带宽之间日益扩大的差距。随着 CPU 和 GPU 的发展,DDR 和 GDDR 等传统 DRAM 解决方案难以跟上步伐。早期尝试弥合这一差距的方法包括提高时钟频率和总线宽度,但功耗和信号完整性的限制使得进一步扩展变得不切实际。这促使了 3D 堆叠内存等创新解决方案的出现。

在 HBM 之前,JEDEC 于 2011 年为移动设备推出了 Wide I/O DRAM,美光则开发了混合内存立方体(HMC),这是另一种堆叠 DRAM 概念。这些早期设计为 HBM 铺平了道路,HBM 于 2013 年正式标准化,并在两年后首次实现商用部署。自那时起,多代 HBM 不断提升内存带宽和效率,巩固了其作为高性能计算基础组件的地位。

如今,下一代 HBM 内存已在未来 10+ 年内被预告,包括 HBM4 将出现在 NVIDIA 的新 Rubin AI GPU 和 AMD 刚刚发布的 Instinct MI400 AI 加速器上,但我们还有关于 HBM5、HBM6、HBM7 和 HBM8 的详细信息,它们将于 2038 年出现。

在KAIST(韩国科学与技术研究院)和Tera(Terabyte互连和封装实验室)发布的新演示文稿中,这两家公司展示了一个冗长的HBM路线图,其中包含下一代HBM内存标准的详细信息。HBM4 将于 2026 年推出,配备 NVIDIA Rubin R100 和 AMD Instinct MI500 AI 『芯片』,Rubin 和 Rubin Ultra AI GPU 分别使用 HBM4 和 HBM4E。

NVIDIA 的新 Rubin AI GPU 将具有 8 个 HBM4 站点,其中 Rubin Ultra 是 HBM4 站点的两倍,达到 16 个 HBM4 站点,每个变体有两个 GPU 『芯片』横截面,Rubin Ultra 具有更大的横截面,计算密度是常规 Rubin AI GPU 的两倍。

该研究公司调侃说,NVIDIA的新Rubin AI『芯片』的GPU 『芯片』尺寸为 728mm2,每个『芯片』的功率高达 800W,中介层尺寸为 2194mm2(46.2mm x 48.5mm),将包含 288GB 到 384GB 的 HBM4,内存带宽为 16-32TB/sec。『芯片』总功率将达到 2200W,是当前一代 Blackwell B200 AI GPU 的两倍。AMD 即将推出的 Instinct MI400 AI 『芯片』具有更多的 HBM4,具有 432GB 的 HBM4 容量和高达 19.6TB/秒的内存带宽。

HBM4:即将推出的 HBM4 内存标准将在 2048 位 IO 上具有 8Gbps 数据速率,每个堆栈的内存带宽为 2TB/秒,每个『芯片』的容量为 24Gb,相当于高达 36-48GB 的 HBM4 内存容量,每个堆栈的功率包为 75W。HBM4 将使用直接『芯片』 (DTC) 液体冷却,并将使用基于 HBM 的定制『芯片』(HBM-LPDDR)。

HBM4E:更强大的 HBM4E 标准可实现高达 10Gbps 的数据速率、每个堆栈 2.5TB/秒的内存带宽和高达 32Gb 的单片容量,通过 12-Hi 和 16-Hi 堆栈提供高达 48-64GB 的 HBM4 内存容量,每个 HBM 封装的功率高达 80W。

HBM5:我们将看到下一代 HBM5 内存标准首次亮相,NVIDIA 的下一代 Feynman AI GPU 将于 2029 年准备就绪,IO 通道提升至 4096 位,通过 16-Hi 堆栈的每个堆栈 4TB/秒的内存容量作为新基准。业内将看到 40Gb DRAM 『芯片』,其中 HBM5 每个堆栈可驱动高达 80GB 的内存容量,每个堆栈的功率包增加到 100W。

HBM6:在 HBM5 发布后,我们将看到 HBM6 可能会与 NVIDIA 的下一代 Feynman Ultra AI GPU(尚未确认)一起首次亮相,业内将看到数据速率再次翻倍至16Gbps,拥有 4096 位 IO 通道。带宽翻倍至 8TB/秒,每个 DRAM 『芯片』的容量为 48Gbps。HBM6 将是我们第一次看到 HBM 堆栈超过 16-Hi,HBM6 将事情推向 20-Hi 堆栈,每个堆栈的内存容量增加到 96-120GB,每个堆栈的功率为 120W。HBM5 和 HBM6 内存都将采用浸入式冷却解决方案,HBM6 使用多塔 HBM(有源/混合)中介层架构,以及网络交换机、 Bridge Die 和 Asymmetric TSV 在其研究阶段。

HBM7:HBM7 将拥有每个堆栈 24Gbps 的引脚速度,更宽的 8192 个 IO 通道(是 HBM6 的两倍),每个 DRAM 『芯片』的容量为 64Gb,由于使用了 20-24-Hi 内存堆栈,每个堆栈提供 160-192GB 的巨大 HBM7,以及每个堆栈的 160W 功率包。

HBM8:我们至少在 10+ 年内不会看到 HBM8,预计将于 2038 年发布,但我们将看到 32Gbps 的数据速率和 IO 速率再次翻倍,达到 16,384 个 IO 通道。HBM8 将提供每个堆栈 64TB/秒的带宽,每个 DRAM 具有 80Gb 容量,每个堆栈高达 200-240GB 的 HBM8 内存容量,以及更高的 HBM 站点封装功率 180W。

*声明:本文系原作者创作。文章内容系其个人观点,我方转载仅为分享与讨论,不代表我方赞成或认同,如有异议,请联系后台。

特别声明:[HBM,十年预告] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

七月廿六“定日”:一不碰、二不回、吃三样 安稳过秋有讲究

这几天天气异常炎热,燥气明显。明日是农历七月廿六,也是“定日”。在传统黄历中,“建、除、满、平、定、执、破、危、成、收、开、闭”这十二神循环往复,用以判断日子的吉凶宜忌。每天对应不同的值神,而“定日”则意味着安定、稳定和固定

七月廿六“定日”:一不碰、二不回、吃三样 安稳过秋有讲究

拼多多百亿补贴!MADEN男士纯棉打底衫特惠(拼多多百亿补贴券在哪里抢)

2025-09-16 09:36:33 作者:狼叫兽拼多多百亿补贴活动来袭!MADEN马登工装推出美式复古重磅口袋三本针男士纯棉短袖打底衫。这件T恤👕极具阿美咔叽风格,纯棉材质打造,是夏日必备好物。 原价6…

拼多多百亿补贴!MADEN男士纯棉打底衫特惠(拼多多百亿补贴券在哪里抢)

罗素·克劳《纽伦堡》首映获盛赞,沉寂多年,昔日影帝强势回归(罗素·克劳作品)

沉寂多年的奥斯卡影帝罗素·克劳带着王炸新作杀回来了!就在今天,这部名为《纽伦堡》的重磅炸弹在多伦多电影节引爆全场——要知道,在这个以冷静著称的电影节上,能让观众集体起立鼓掌4分钟,真的是破天荒的头一遭!外媒狂…

罗素·克劳《<strong>纽伦堡</strong>》首映获盛赞,沉寂多年,昔日影帝强势回归(罗素·克劳作品)

演员陈瑾:从不吃米饭,与哥哥约定一辈子不婚不育,现在怎么样了(演员陈瑾介绍)

在陈淮的支持和鼓励下,陈瑾更加坚强地决定成为一名演员。她用执着和勇气,为自己的人生写下了浓墨重彩的一笔。从怀揣梦想的懵懂少女,经过20年的磨练和努力,终于成为备受瞩目的实力派演员,为我们演绎了一出惊心动魄的…

演员陈瑾:从不吃米饭,与哥哥约定一辈子不婚不育,现在怎么样了(演员陈瑾介绍)

哈尔滨试鸣防空警报 市民驻足默哀 全市同步演练(哈尔滨今天为什么拉响防空警报)

经哈尔滨市人民政府批准,2025年9月18日9时00分至9时10分,在全市辖区内进行人民防空警报试鸣演练

哈尔滨试鸣防空警报 市民驻足默哀 全市同步演练(哈尔滨今天为什么拉响防空警报)