『芯片』参数 “卷疯了”!MI450 对决 Vera Rubin,TGP、带宽双双猛增

『芯片』参数 “卷疯了”!MI450 对决 Vera Rubin,TGP、带宽双双猛增

现在AI对算力的需求涨得那叫一个快,大模型训练也从以前的FP32精度往FP8、FP4这种低精度走,这就对硬件的能效、内存快慢还有瞬间能爆发出的算力要求更高了,这不直接把NVIDIA和AMD在AI架构这块儿逼得贴身肉搏了。

两家都在紧急改下一代产品的设计,而这场比拼的核心,就落在AMD的Instinct MI450 AI系列和NVIDIA的Vera Rubin身上,比之前任何一代产品都打得凶。 AMD的高管Forrest Norrod说MI450是他们家的“米兰时刻”,这话其实挺有底气的。

当年EPYC 7003系列『服务器』『芯片』一出来,直接把英特尔在『服务器』市场的垄断给破了,现在他们就盼着MI450能在AI『芯片』这儿再来一回这风光事儿。Norrod甚至直说,MI450肯定比NVIDIA的Vera Rubin更能打,而且下一代产品线肯定用自家的技术栈,绝对不用“Team Green”(就是NVIDIA)的。

这话不是空口吹牛,看产品参数的调整就知道了。为了压过对方,MI450X的热设计功耗(TGP)比最开始多了200瓦,NVIDIA那边也没辙,把Vera Rubin的TGP加了500瓦,直接干到2300瓦了。

内存带宽更狠,Vera Rubin每块GPU从13 TB/s飙到20 TB/s。 我觉得啊,这种参数猛涨,一方面是行业里对算力太着急了,另一方面也看出现在AI硬件竞争有点短视,光靠加功耗、提带宽换性能,虽然能快点满足大模型当下的需求,但长远来看,能效比才是真本事,能靠这个拉开差距。

AMD敢这么叫板NVIDIA,除了参数追上了,更关键的是它在『服务器』『芯片』那儿攒下的chiplet设计经验,这给MI450的架构优化托了底。 ## 二、技术都差不多了?

AMD追上来的门道在这儿 以前AMD在AI『芯片』这儿跟NVIDIA差得挺多,倒不是说它不会设计硬件,主要是产品更新速度跟不上NVIDIA。NVIDIA有CUDA生态这个先发优势,能跟着市场需求快速调产品路线,AMD之前在软件适配和开发者这块儿没跟上,显得硬件差距更大了。 不过等Vera Rubin和MI450一交手,这差距眼看着要变小了,关键就在于两家要用的核心技术都差不多。

从硬件底子来看,不管是HBM4高速内存、台积电N3P工艺节点,还是基于chiplet的模块化设计,都是两家的标配了。

这可不是巧合:HBM4能存更多东西,速度还快,正好解决AI计算里“内存不够快”的瓶颈;台积电N3P工艺比以前的更省电,性能还好,高端『芯片』想降功耗都得靠它;chiplet设计就是把不同功能的小模块拼起来,能省研发钱,还能更快出新品。 值得说的是,台积电N3P工艺的产能有限,两家同时用,说不定会在供应链上较劲,甚至影响产品啥时候能上市。

Dan NVIDIA真正的优势不是硬件参数,是CUDA平台攒下的几百万开发者和一大堆优化工具。AMD要是真想打破垄断,除了硬件能打,还得在ROCm生态的适配速度、给开发者的支持上多下功夫——不然硬件再强,没有软件撑着,也落不了地。

D2D互连技术

除了AI『芯片』打架,AMD还有个技术突破得说说,给Zen6处理器准备的D2D(『芯片』到『芯片』)互连技术,现在已经能在StrixHalo APU上看到点影子了。 这背后其实是行业的需求变了,现在NPU(神经网络处理单元)都往CPU里塞,传统的『芯片』间通信技术早就不够用了,成了性能的绊脚石。

在这之前AMD从Zen 2开始就一直用SERDESPHY技术让『芯片』之间通信——简单说就是把并行数据转成一串比特流,在基板上传,到另一边再转回去。这方法虽然解决了传统基板上不好布几百条铜线的问题,但转来转去特别费电,还会拖慢速度,尤其是NPU要跟CPU、GPU快速配合的时候,这毛病就更明显了。

现在Strix Halo直接不用SERDES了,改用台积电的InFO-oS技术和重分布层(RDL),但具体咋弄的呢?

就在『芯片』下面由RDL做的“中介层”里,布了几条又短又细的并行线路,靠着InFO-oS技术在硅『芯片』和有机基板之间布线,这样CPU就能通过宽端口直接通信了。

说起来能发现这新方法,是因为Strix Halo上有块长方形的小焊盘,这是“扇出”技术的典型样子,而且原来的大“SERDES”模块也没了,这么一改不用转来转去了,功耗和延迟都降了不少,更关键的是CPU上多加了些端口,整体带宽也上去了。不过这方法也有麻烦,多层RDL设计起来挺复杂的,而且『芯片』下面的空间都被这些线占了,得好好调布线的优先级。

但不管咋说AMD在Strix Halo的D2D互连这儿做得是真不错,而且这方法估计会用在Zen6处理器上。我觉得这能看出AMD的思路,不跟NVIDIA在生态上硬拼,而是从硬件底层找突破,解决通信这个小瓶颈来建立优势。

虽然见效慢,但能攒下别人抄不走的技术家底。等Zen6用上这技术,AMD说不定在『服务器』、电脑这些地方,既能提升AI性能,通用计算能力也能涨,跟NVIDIA的差距就更小了。

特别声明:[『芯片』参数 “卷疯了”!MI450 对决 Vera Rubin,TGP、带宽双双猛增] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

罗霖被家暴17年,蓝洁瑛遭性侵暴力还被围观!女『明星』️的暴力事件还有很多(罗霖男友)

在结婚没几年后,罗霖提出了离婚,根据罗霖透露,离婚的原因是自己被家暴和男方出轨。 但尽管铁证如山,黄毅清依然是各种狡辩,在『社交媒体』上给黄奕泼脏水,导致黄奕的名声和演员事业都受到了打击,但等到2019年,黄毅…

罗霖被家暴17年,蓝洁瑛遭性侵暴力还被围观!女『明星』️的暴力事件还有很多(罗霖男友)

苏醒张远陆虎参加的最失败综艺,你们是不是接错了活儿?(苏醒张远陆虎合唱你曾是少年)

十天之后回到现实这档节目,虽然未能达到我们的期待,但它也给了我们一个机会,让我们重新审视自己的需求和期待。也许,这正是节目想要传达给我们的信息:在这个充满诱惑的世界中,我们需要的,是一次真正的回归,一次心灵…

苏醒张远陆虎参加的最失败综艺,你们是不是接错了活儿?(苏醒张远陆虎合唱你曾是少年)

狗狗猫咪专用大尺寸防水餐垫,真香警告⚠️!(猫狗宠物用品)

新款宠物喂食垫采用软质PNVC皮革,大尺寸设计适配多宠家庭,超强防水防污,底部防滑纹路稳如泰山。一键擦拭即净,彻底告别餐桌狼藉。养宠人的“懒人救星”,真实用才敢说真香!

狗狗猫咪专用大尺寸防水餐垫,真香警告⚠️!(猫狗宠物用品)

深度学习OCR爆发:98%准确率背后,正在重构6大行业的效率革命(深度识别ocr『安卓』版下载)

结语:效率革命的本质,是让技术 “服务于人”从传统 OCR 的 “笨拙”,到深度学习 OCR 的 “智能”,这项技术的进化史,本质上是“技术服务于人” 的进化史 —— 它让银行柜员告别 “重复录入”,有更多…

深度学习OCR爆发:98%准确率背后,正在重构6大行业的效率革命(深度识别ocr『安卓』版下载)

国庆中秋假期安全提示 全面保障出行安全(国庆中秋假期安全教育主题班会记录)

应急管理部发布国庆中秋假期安全提示,提醒公众注意以下事项:国庆中秋假期出游集中,景区需强化人流监测和引导,确保缆车、索道、吊桥、观光车船、大型游乐设施等的安全。同时,各类新兴游乐项目也应加强安全管理

国庆中秋假期安全提示 全面保障出行安全(国庆中秋假期安全教育主题班会记录)