NVIDIA RTX 30系列架构详解（二）

2020.9.28

王辉

致力于为分析测试行业奉献终身

与台积电的7nm工艺晶体管密度大约1亿／mm2相比，8nm工艺大概是6000万晶体管／mm2，但这是单一的SRAM芯片的对比，实际上GPU芯片比较复杂，差距会缩小很多。

根据是NVIDIA公布的信息，台积电7nm工艺制造的安培A100核心是540亿晶体管，核心面积826mm2，而三星8nm工艺制造的GA102核心是280亿晶体管，核心面积官方没公布，据悉是628mm2，也是大核心了。

这么算下来，7nm A100核心的晶体管密度6560万晶体管／mm2，而三星8nm的GA102核心也有4460万晶体管／mm2——差距仍在，但似乎可以接受了。

三星8nm工艺的晶圆代工价格还是秘密，但是不论技术还是商业策略上，三星都会比台积电便宜很多，预计代工价格能差30％或者更高，所以这也是RTX 30系列显卡能够不涨价甚至降价的关键。

NVIDIA RTX 30系列架构详解：8nm安培GPU的两倍性能从何而来？

那三星8nm工艺带来了多大的性能及能效提升呢？首先大家可以看到RTX 30系列显卡的频率提升了，从RTX 20系列的1．5GHz＋提升到了1．7GHz＋，升级工艺还是有性能提升的。

不过RTX 20系列的加速频率实际可以达到1．9GHz甚至接近2GHz，RTX 30系列预计也就这个水平。

但是能效还是有提升的，NVIDIA官方称在60fps性能下，图灵显卡的功耗大约有240W，安培显卡则是120W多点，算下来是1．9倍能效，提升了90％，同时温度还低了3度，噪音减少2分贝。

总的来说，在工艺这方面大家对安培GPU有惊喜有失望，失望的是没有上预期中的7nm工艺（不管台积电还是三星），工艺依然升级到了8nm。

但是NVIDIA工艺虽然并不算激进，但性能、能效进步还是挺大的，安培显卡各方面指标都是大幅胜过现在的图灵卡，而且价格做到了不升反降，这也是不追求激进工艺的好处，反正之前12nm都能赢，现在上8nm更加稳妥了。

安培GPU架构详解之：FP32单元翻倍 CUDA核心改了什么？

发布安培的时候，NVIDIA CEO黄仁勋表示这是GPU有史以来最大的性能飞跃，而2018年推出图灵GPU时，老黄也是类似的说词——GPU有史以来最大的变革，这两个评价其实也没错。

图灵GPU架构有很多第一次，首次支持RTX Core（光追加速单元），首次支持Tensor Core，同时还改进了CUDA内核，不过前两个是重点。

NVIDIA RTX 30系列架构详解：8nm安培GPU的两倍性能从何而来？

在安培GPU上，RT Core、Tensor Core当然继续加强，不过最主要的亮点是CUDA架构的改进，性能翻倍的根源就在这里，我们先来看看这方面的变化。

NVIDIA RTX 30系列架构详解：8nm安培GPU的两倍性能从何而来？

GA102核心架构示意图

GA102核心总计7组GPC单元，每组有12组SM单元，总计84组，RTX 30系列显卡视乎规格不同启用的SM单元总数不同，RTX 3090是82组，RTX 3080是68组，RTX 3070是46组。

NVIDIA RTX 30系列架构详解：8nm安培GPU的两倍性能从何而来？

在之前的GA100大核心中，每组SM是64个INT32单元、64个FP32单元及32个FP64单元组成的，但在GA102核心中，FP64单元大幅减少，增加了RT Core，Tensor Core也略微减少。

互联网

分析测试百科网

NVIDIA RTX 30系列架构详解（二）

王辉

液体保温柜报价核心配置详解-医用气体

保冷柜（百级）核心配置详解-医用气体

二甲医院用药品加温柜核心配置详解-介入手术室装修设备

保温柜（千级）核心配置详解-医用气体

30万/项！国自然“博士生基金”来了

一文详解“锂离子电池-负极材料”

30%乙二醇水溶液冰点温度

杭州质谱大会系列专访——刘淑莹教授

一、二、三、四代测序技术原理详解

白话胶体金系列——第一话<烧金> （二）

白话胶体金系列——第二话<标记>上篇

白话胶体金系列——第二话<标记>中篇

白话胶体金系列——第二话<标记>下篇

第三代半导体材料氮化镓(GaN)技术与优势详解（二）

电子元器件批次详解（二）

NVIDIA RTX 30系列架构详解（七）

NVIDIA RTX 30系列架构详解（六）

NVIDIA RTX 30系列架构详解（五）

NVIDIA RTX 30系列架构详解（四）

NVIDIA RTX 30系列架构详解（三）

NVIDIA RTX 30系列架构详解（一）

HFSS端口应用详解：Wave Port 、Lumped Port（二）

Western Blot详解

Western Blot详解（二）

喜欢作者

NVIDIA RTX 30系列架构详解（二）

王辉