额……老铁们,我图吧老捡垃圾的了。
今天咱们谈谈显卡嗷
更新的原因是最近刷到个视频有点难蚌,简单看下情况:
省流:怕被制裁所以在有限的晶体管和核心面积下不敢堆显存控制器规格。然而无法有效解释实际的问题,这点我们本期会说。
首先回答一下封面这个问题,显存雀食不能只看容量越大越好,也要看实际带宽通常看显存类型和位宽。
对于跑AI这种简单负载来说,显存优先保证容量再追求速度是正确的,带宽再高爆显存了也是白给。
游戏其实也是一个道理如果爆显存了那讨论速度就没有意义了
所以在显存容量较小难以满足使用需求的前提下显存还是越大越好的。
这年头显存需求普遍偏大优先保证不爆显存才是第一位的。
简单来说,如垃圾佬现在主用上位机的显卡,同样容量下肯定是显存带宽越大越好,然而这玩意是个4G显存,这年头想干点啥就比较吃力了,所以如果有得选换个8G显存哪怕带宽下降一些也是值得的。而且咱恰好知道有办法可以换显存不用动GPU。
笑点解析:UP置顶
难道不是这么回事吗
实际上雀食是这么回事,GPU里的显存控制器通常只能决定显存的种类和位数,至于上多大显存完全看显存颗粒的成本
比如GT240的GT215就可以支持DDR3 GDDR3 GDDR5然而都是128bit到头了
所以普遍是4颗显存完事
至于上1G D5还是GD3甚至512 DDR3完全看厂家良心
DDR3是真的便宜,结果就这当时的厂家还不满足,整出了TC512这种烂活——共享512M显存,实际上只有256M或128M。
本来咱以为TC512 TC1G已经够NB了,然而那年头还有高手:
用GT215核心上DDR2的就nm离谱。
家里得请哈基高了。
所以很简单的道理各位就能看明白同样的GPU核心设计的时候如果有多种显存类型的支持那么根据不同厂家搭配不同显存很容易就能千变万化,不同显存配置的显卡即使是同一个核心实际表现也完全不一样。
比如HD7850在后续马甲卡R7 370P里就上了4G的显存,原装HD7850就大部分都只有1G 2G少数魔改卡才会有4G,但是不影响这些卡都是256BIT GDDR5:
HD7850 1G 2G本质上都是同样的GPU核心搭配了不同的显存颗粒,8颗256还是128看需求。
也有少数HD7850妖卡直接上4G显存的,操作起来很简单,就把显存容量继续翻倍就行了。
所以实际体验来看HD7850 1G虽然GPU性能还是过关的,但是由于搭配1G显存导致经常容易卡爆显存,所以玩同样的游戏相比更大的显存容量很多时候就迫于显存压力不得不降低画质了。
在FSR2.0加持下HD7850 2G现在用来玩原神勉强能顶0.8 1080P高画质
之前垃圾佬有过一张HD7850 4G,然而GPU频率被锁的比较死拉到头还不如这张MSI R7850 HAWK的默频高而且仅有一张就一直没用,最近隔壁给了咱一张R7 370P才发现原来HD7850是有官改4G的,频率不低默频就比垃圾佬的7850 HAWK高了,甚至核心都是16年生产的就很灵性了。
16年40周,4G尔必达GDDR5共8颗显存,原来一代神卡HD7850也很多年都没停产,只不过改名了。
这就和麒麟710一样,配4+64G直接卡爆但是配6+128起步就不太容易卡了,配8+256直接起飞不敢说至少比4+64使用体验那是高到不知道哪去了,即使大部分这么配的710A CPU主频还比710/710F之类的低了0.2G。
所以这年头麒麟710没停产据说华子还整出了自有产线下线和原设频率相等的710H咱就一点都不意外了。好的产品是可以经受住时间检验的。一代神卡一代神U都是相通的。
GPU也是一样的道理,所以显存给多少完全看厂家良心
HD7850的4G显存(单颗512)应该还不是上限,GDDR5又不是没有更大的甚至有单颗1G的上就完事了。
再举个例子GP106的P106-100和P106-90或者各位更熟悉的1066和1063后者相比前者GPU核心都有不同程度的阉割屏蔽缩减然而显存位宽并没有变化都是192bit,至于是3G还是6G还是未来可以魔改的12G显存就看单颗显存颗粒给多大容量
1065这种5G显存反倒是缺通道只有160bit导致即使1颗1G也只能有5G,如果上单颗512甚至只有2.5G
说到这想起一些好笑的事了
当年牢黄的矿卡计算卡P104普遍都给的是4G的显存,然而和P106-90不一样的是P104无论是-100还是-101都可以刷一个VBIOS完美出8G显存,因为GP104只支持GDDR5X显存,而GDDR5X显存是没有单颗512的容量的,所以和P106-90或者1063不一样,所有的P104只需要刷就100%能解锁8G显存无一失败。
这也意味着越先进的显存类型单颗容量的起点往往是会更大的。现在的GDDR6 GDDR6X GDDR7单颗容量应该只会更大。
综上,显卡的显存容量雀食和GPU有关系但不是很大。
大概其一个显卡支持的显存类型和位宽已经确定了就能确认
至于剩下的全靠厂家良心。
垃圾佬在换显卡之前的K3000M就是一个奇葩
非完整版GK104大残核心(SMX单元砍半),然而却比完整版GK104的GTX680台式机显卡的显存容量都大一倍。
我都不知道4G显存在架谁。
更糟糕的是作为专业卡这玩意居然还锁驱,正常方式无法安装同款核心的显卡最新驱动。
这款核心垃圾佬掐指一算从19年第一次入手GTX670到现在也是在各类显卡上用了5年左右才彻底退役,同时期的GCN1.0的HD7850的Pitcairn核心至今仍作为游戏机主力未退役估计少说还能再战五年。
之前垃圾佬的主力机上的GPU是还有高手的,就是这款大残版本的GK104 K3000M,核心整整砍了5/8的SMX单元,还剩3/8,基本砍没了,活着的晶体管比亖了的还少。
换掉它的主要原因除了大残核心性能不够用功耗偏高以外还有一个最致命的问题,那就是它不支持H265编码。作为接采集卡录像的上位机这年头还在用H264是不合格的。玩游戏都可以不用它但是视频编码器只有H264那上传视频就是实打实的多费时间多传东西了还没啥意义反正现在视频网站都给码率砍成史了不如上个H265还能省点时间。
至于显存啥的在这种环境里甚至都不重要反正多大显存最后也就是个视频编码卡
最后回到这个视频的问题,首先评论区依然辣眼睛
不愿意给显存是怕被制裁这种结论不知道是视频引导的还是来评论区团建的炒股团自己想出来的。
显存的大小上限取决于GPU支持的显存类型和位宽也就是通道数,但是平心而论这点还远达不到因为怕被制裁所以设计的时候就故意做小的程度。
毕竟看参数怎么说也是GDDR6了应该不会整出什么4G 8G显存吧。
倒是相比IMG系powerVR买IP字研国潮显卡的16G显存小了一点但是也不多。现阶段12G和16G显存在游戏中的表现差距几乎可以忽略不计了,真正有问题的是AI,很多模型应该正好会卡在这个显存大小比较难受。
所以说核显是最好的AI部署环境,因为这玩意能共享系统内存理论上有非常大容量的显存,用来跑AI慢是慢了点但是基本告别显存焦虑了。
我倒是更好奇7G100这玩意专业卡给的显存依然是6的倍数会不会GPU设计的时候就是只有192bit的祖传位宽,这样的话显存带宽相比隔壁MTT S80的256bit GDDR6雀食会小一些。那就只能靠频率找了。
不过牢摩线程现阶段已经通过实践证明了所谓的春晓苏堤IMG BXT改架构完全是个笑话了,驱动就算修到WIN11停服也打不过3060甚至100一张的P106。这玩意GPU硬件就算堆到5090规模也是白给,不如自研GPU一根。S3后代随便掏出个国产自研架构都能一脚踢亖这群国潮货。牢摩线程四处挖人东拼西凑的团队到现在看没看懂IMG的架构设计都两说,转自研架构更是没影的事。
当年咱看不懂的,现在咱完全能看懂了。
当年咱以为GPU这种东西能用就得,买IP能咋地只要国内能生产代工不一样用。结果MTT S80用事实证明了买回来的IP还真就没法用,因为这玩意是手机GPU放台式机上连硬件动态频率调节都没做上电待机功耗100W+一用一个不吱声。就这还是TSMC 7nm工艺生产出来的只能说是纯招笑了(当然,被制裁掐脖子之后肯定是代工不了的,一掐脖子就翻白眼说的就是这种)。
现在回头看S3这边架构底子还是比IMG好得多的。S3后代有很多,正朔兆芯格兰菲这边工艺给的一直很保守都是按完全能国产大量自主生产的工艺设计的GPU,所以架构很好但是不出活,产品水平还是停留在S3当年的水平就集显亮机卡那样。不过就这也比多少年前就被踹出PC市场的IMG PowerVR架构水平要强得多的。自研架构水平有多强现在的7G100就是证明。
不过这个视频的大量神论还是令人相当难蚌的:
很难想象S3的后代会说出这种话,能说出这话的当真是20年前就开始做GPU的S3大陆研发团队的人吗?
为啥说怕被制裁所以晶体管数量核心面积有限所以没给太高的显存规格是虾扯蛋是因为显存控制器在GPU里还真就不是什么特别占地方占晶体管的东西。
上图是三潮元老RX580牢矿卡的DIESHOT,@硬件趣玩 提供。
可以看到256bit GDDR5的显存控制器在显卡核心中只占了很小的一部分。
而RX580是可以通过魔改显存颗粒直接出16G显存的。
Polaris 20还只是GF/三星14nm工艺下2304SP的一款面积相对较小的核心(232mm²),晶体管数量5,700百万。
一些较大的核心比如GP100显存控制器占的面积比例就更小了。
GP100是一款TSMC 16nm工艺(密度小于三星GF14nm)610 mm²的大核心。拥有3840SP,晶体管数量15,300百万。支持4096 bit HBM2显存,标配为16GB。
简而言之,显存控制器这玩意多一组少一组对GPU面积产生的影响不说也是几乎可以忽略。
那真正的原因呢?
其实原因也非常简单,这里我们不多说,直接放图:
这事兆芯格兰菲标的Arise1 GT10C0独显工程卡,这卡其实在S3的年代就已经立项了当时应该叫Elite3000还是多少来着我忘了,反正现在做7G100这伙人如果宣称自己也是S3后代的话那么指定是接触过这卡的。
它的显存如图所示是6颗为一组工程卡没记错应该是正反两面PCB都有一组显存的。
GPU的显存通常一颗为32bit那么这卡就很简单了要么192bit要么384bit。
根据后来实际发布的情况来看GT10C0应该是64/128bit的显存位宽合理推断工程卡应该最多也就是192bit的规模
我们不说7G100到底是不是Arise改的,就这帮人参加过的GPU项目来看应该是完全没做过192bit以上的GPU设计项目,而且实际条件也不支持上来就搞大吞吐量。
这伙人经手过的独立显卡项目其实设计水平并没有那么先进的,没做过超大规模核心的独显设计。
10C0其实也就1536SP,架构水平往好了说相当于GK104,对,就垃圾佬之前那款台式机用完笔记本用,祖传用了5年实在是浑身难受最后直接换Maxwell GTX960同款核心MXM显卡的那款GPU。
说难听点S3架构水平虽然吊打IMG七个来回带拐弯的有余但是相比IAN还是有差距,很可能给了太高的显存位宽最后发现也用不上。
不信各位看10C0工程卡还有192bit 12颗显存等到正式版发布的时候就变成了64/128bit 4/8颗显存不就明白怎么回事了吗。
至于评论区牢摩KPI说的双芯卡只能说想多了,Arise2立项的时候压根没考虑过双芯,以S3牢年头的水平可能弄点双芯弄点SLI还有可能,但是现在嘛你别想。早就没有crossfire SLI双卡或者其他双芯卡的环境喽。
兆芯倒是在自研总线上搞的风生水起之前已经掌握了类似牢A的CCD+IOD chiplet结构并且有了理论上性能更优的跨DIE连接方案最近还搞出了自带NPU的KX7000N,不过不知道这个总线对多GPU是否有效。
ZPI总线的设计应用场合很可能就不是和NVLINK一个环境,而且就算支持多GPU现在砺算这帮人也未必能使用这个总线技术。
这帮人在国企内部好好的日子不过非得跳槽中天恒星搞得家破人亡,然后继续跳槽继续极度困难,无论怎么折腾就是不愿意回国企内部。咱看完也是无语子,看不懂这帮人到底图啥。图钱吧也没捞到,奔个前程也没混出个结果来,最后反倒还不如不折腾。
终于理解牢胡说的什么叫龙芯中科不发军饷最有战斗力用思想打造什么有战斗力的团队了。虽然牢胡这种操作在咱看来完全是PUA,但是结果来看这样的团队至少不会项目做一半人卷着资料跑了。
我的评价是现阶段先别管架构哪来的了,先让兆芯GPU部门出走这些人靠这张卡活下来再说吧,不然和牢摩线程这种买IMG IP的字研国潮显卡一样也是一炮货永远没有下代了。
所以现在看来7G106配12G显存基本可以确定和GPU本身的显存控制器无关了,GDDR6又没加盖没人拦着你不让你上24G显存。
穷就说穷,别说没用的,强行找补只会让懂行的更看不起你
不就是没有钱量产大容量显存型号怕挨骂派人出来试探消费者口风吗,动机都能理解但是完全没必要整这死出
只会让能看懂的感觉到滑稽
你要真嫌12G显存小那就做一批24G的呗,回头卖的时候和其他正常显卡厂家一样高低搭配要大显存就加钱就完事了,说别的都没用。
所以相信看到这各位大概都明白怎么回事了,那么本期就先到这吧。
后续如果有更多问题记得联系,咱会尽到图吧垃圾佬的职责去伪存真把相关的真相挖出来。
就这样,谢谢朋友们!