台积电|全面升级带来性能暴涨 Ampere 架构新特性看这里( 三 )

2026-01-12

全新8nm工艺加成，芯片整体效能激增
跟竞争对手AMD近年来在制程工艺的大动作不同（从格罗方德的12nm直接提升至台积电7nm）， NVIDIA近年来的工艺提升可谓非常"低调" ，从Pascal（10系列显卡）的台积电16nm工艺到Turing（20系列显卡）的12nmFFN工艺（实际上算是16nm的改良版），制程上的提升并没有它们的性能提升来的激进。
虽然NVIDIA要在Ampere架构上升级制程工艺基本是早已被确认， 5月份发布GA100核心也使用上了全新的台积电7nm工艺，在RTX30系列显卡正式发布前，大家都以为他们将继续采用这一工艺，而NVIDIA却在发布会上官宣了RTX30显卡将使用三星的8nm工艺。
这一工艺虽然是在三星10nm工艺的基础上改良而来，但是却为Ampere架构的效能提升立下了汗马功劳，同时也不得不佩服NVIDIA的芯片设计能力。

文章图片

文章图片

图片来源igor'sLAB
采用12nmFFN工艺的RTX2080Ti（TU102核心）在764mm的芯片面积内装入了186亿个晶体管，而这一代的RTX3080（GA102核心）却能在628mm的芯片面积内塞入了280亿个晶体管，密度提升几乎翻倍，但稍逊于采用台积电7nm工艺的GA100核心（在828mm的芯片面积下塞入了540亿个晶体管）.
具体密度上， 7nmGA100的6521万个/mm>8nmGA102的4458万个/mm>12nm的TU102的2434万个/mm ，三种工艺带来的密度差异还是比较明显的，虽然RTX30系列没有用上7nm工艺，但是三星8nm工艺对比台积电12nmFFN工艺带来的提升还是非常显著的。
NVIDIA最终选择三星8nm工艺可能也有运行频率上的考量， RTX3080在拥有比RTX2080Ti翻倍的CUDA核心数的情况下，仍能获得更高的Boost核心频率，而目前的7nm工艺可能还没法做到这一点，用在超算卡的GA100则不需要太高的运行频率，此外，不选择台积电7nm工艺可能也有产能方面的考量。

文章图片

文章图片

制程工艺的升级还带来了能效比方便的提升， NVIDIA官方宣称在同样的60FPS帧率时， Ampere架构显卡的能耗比可以达到Turing架构显卡的1.9倍，要实现同样的性能表现，前者只需120W多点的功耗，而后者则要240W的功耗，并且前者的还温度低了3°C ，噪音也减少了2dB ，这个提升还是非常可观的。
GDDR6X显存加持，为极致性能保驾护航
RTX3090和RTX3080用上了全新的全新的GDDR6X显存，这也是RTX30显卡的性能表现得到大幅提升的重要因素之一，特别是在高分辨率、高光追特效等应用场景下，显存的容量和带宽都很容易成为显卡性能的瓶颈。

文章图片

文章图片

尤其是在发布会演示的8K@60Hz+全光追特效这种极限应用场景下，性能更加强悍的GDDR6X显存可以让Ampere架构处理器更好地释放性能。

文章图片

文章图片

GDDR6X除了在GDDR6对运行频率进行超频，最重要的改进就是首次在显存上使用了PAM4编码。

文章图片

文章图片

相比传统的"NRZ"编码方式， PAM4编码可以让显卡在每个时钟周期内传输更多数据（从原来的每个时钟周期发送两位二进制数据，升级为每个时钟周期发送四位二进制数据），这也让GDDR6X的最大显存频率从GDDR6的16Gb/s提升到21Gb/s ，也拥有超过1TB/s（1050MB/s）的理论显存带宽上限，这个表现已经达到HBM2的1TB/s带宽的水平。

推荐阅读

上一篇：地球|距离地球6光年之外，科学家发现“超级地球”

下一篇：华为手机|iPhone12没发布！果断舍弃，选择华为荣耀V30 Pro