如何看待新推出的Nvidia推出的4090d?

12999和4090价格一样。看了cuda规格是完整的ad102的百分80。这是以往80的规格吧?看fp32和fp16也印证了性能和4090的匹配的差…
关注者
183
被浏览
741,038

68 个回答

老黄的刀法还是很精准的,这次RTX 4090D刚好卡在3A090出口管制条例的界限上。

再解释下3A090,这次管制条例基于TeraFLOPs乘以Bitlength,被简称为TPP。对于“数据中心芯片”和“非数据中心芯片”,TPP的生效范围是有区别的。“数据中心芯片”生效范围比较复杂,但是“非数据中心芯片”一刀切在TPP = 4800上,也就是说对消费级RTX 40显卡,TPP限制是4800上。

而这张RTX 4090 D,该显卡搭载14592个CUDA 核心,加速频率 2.52GHz,该显卡搭载14592个CUDA 核心,加速频率 2.52GHz,显存为 24GB 384bit GDDR6X,显卡总功耗 425W,常规游戏功耗 302W。

那么对应的INT8算力就是588.34944 TeraFLOPs,对应的TPP是4706.79552,差1.94688%就过线了。

从参数上来说,皮衣刀客已经尽力了,没什么好说的,这事情本来就是雷蒙多这帮政客发癫导致的。

定价12999元没什么道理,不过现在显卡的“原价”象征意义大于实际意义,过去所有RTX 40系显卡都逃不了破发的命运,所以RTX 4090 D不久也要破发。

另外,这次RTX 4090 D为了防止TPP超过3A090条款限制,把Boost频率也给锁在2.52GHz,且不支持超频。所以所有品牌的RTX 4090 D众生平等,全是2.52 GHz。如果你是刚需用户,挑各家AIC最丐的几款买就行了。

说明贴吧那群嘴硬的人可以洗洗睡了。

整个简中互联网就没几个能把整件事情梳理明白的,包括某顶级券商的那个所谓分析,参数都算错了。

总结一下,非数据中心产品不受3A090条款的细则限制,但受TPP小于4800的NAC限制

RTX 4090超标的主要是Tensor算力,CUDA算力暂时安全

RTX 4090D有456个Tensor Core,Boost频率2.52G。Ada Lovelace和Ampere(仅GA102及以下,GA100要翻倍)的Tensor Core都是128个FMA对于FP16,FMA被认为是两个运算(乘和加)。

所以RTX 4090D的TPP=128*2*2.52G*456*16=4706.8TOPS,刚好卡了限制的边界。


下面是问答环节:

1、未来还能买到NVIDIA的高端卡吗?

难说。TPP卡的是总算力,非数据中心应用的限制条件相对宽松,但不是没有。之前禁运的A100、H100还可以从阿联酋等渠道转运,现在美国发现了漏洞并采取了进一步应对措施,水货的渠道会越来越难(港澳不用考虑了,在美国政府出口政策里这两地方跟内地已经没有区别)。最关键的是,如果TPP指标不动态调整,下一代可能就是从5080开始了,然后再迭代几代就全面禁运了。就算只看用于图形渲染的矢量FP32算力,其实消费级旗舰离4800的TPP限制也没有很大距离,大改两代左右就超了。

2、NVIDIA会为了中国市场推出特意降低Tensor算力的产品?

很难。NVIDIA切分不同规格的最小单位是SM,而SM内部的结构对于一代微架构是固定的,Ada Lovelace每SM中4个Tensor Core。AD102一共144组SM,RTX 4090启用了128组,而4090D是114组。动了SM内部会造成指令层面的不同,就不是同一微架构下的产品了,NVIDIA不可能单独为中国市场研发一套微架构,这反而会造成其生态的分裂。

3、AMD、Intel的产品可以平替?

不太行。Intel第一代Arc独显所用的Xe-HPG就有独立的XMX单元,跟Tensor Core一样也是矩阵加速单元,只不过性能还够不上制裁标准。AMD的RDNA3架构似乎也是有AI加速单元的,虽然其ROCm生态还差CUDA很远,但是硬件算力还是有的。独立GPU加入矩阵单元强化AI算力是大势所趋,没有人愿意放弃这片蓝海市场的。实际上AMD和Intel的高端数据中心产品已经超标并被禁运了,只是影响没那么大而已。

4、国产替代?

如果你说可以做图形渲染的传统GPU,我觉得5-10年内很难有靠谱的、在民用市场有竞争力的产品,尤其是非移动端。反倒是只做AI或者科学计算的专用加速GPGPU相对容易一点,对驱动、软件适配什么的要求相对低一点。不要把什么XX线程之类给我抬出来,没有自己独立的微架构设计能力,靠外购IP滥竽充数之辈没有前途的。

而且就算过了架构设计、驱动和软件适配的关口,那制造又怎么办呢?壁仞之前做的AI加速GPGPU因为参数亮眼上了实体清单,在TSMC流不了片,现在已经没有下文了。靠制裁前囤积的外国设备能勉强维持一两条先进生产线运转,但是成本不是哪家都可以接受的,而且指不定哪天就歇菜了。至于国产半导体设备,我是更不敢报什么希望的,10年内能支撑国产7nm节点就谢天谢地可。