台积电|全面升级带来性能暴涨 Ampere 架构新特性看这里( 三 )


全新8nm工艺加成 , 芯片整体效能激增
跟竞争对手AMD近年来在制程工艺的大动作不同(从格罗方德的12nm直接提升至台积电7nm) , NVIDIA近年来的工艺提升可谓非常"低调" , 从Pascal(10系列显卡)的台积电16nm工艺到Turing(20系列显卡)的12nmFFN工艺(实际上算是16nm的改良版) , 制程上的提升并没有它们的性能提升来的激进 。
虽然NVIDIA要在Ampere架构上升级制程工艺基本是早已被确认 , 5月份发布GA100核心也使用上了全新的台积电7nm工艺 , 在RTX30系列显卡正式发布前 , 大家都以为他们将继续采用这一工艺 , 而NVIDIA却在发布会上官宣了RTX30显卡将使用三星的8nm工艺 。
这一工艺虽然是在三星10nm工艺的基础上改良而来 , 但是却为Ampere架构的效能提升立下了汗马功劳 , 同时也不得不佩服NVIDIA的芯片设计能力 。
台积电|全面升级带来性能暴涨 Ampere 架构新特性看这里
文章图片

文章图片

图片来源igor'sLAB
采用12nmFFN工艺的RTX2080Ti(TU102核心)在764mm的芯片面积内装入了186亿个晶体管 , 而这一代的RTX3080(GA102核心)却能在628mm的芯片面积内塞入了280亿个晶体管 , 密度提升几乎翻倍 , 但稍逊于采用台积电7nm工艺的GA100核心(在828mm的芯片面积下塞入了540亿个晶体管).
具体密度上 , 7nmGA100的6521万个/mm>8nmGA102的4458万个/mm>12nm的TU102的2434万个/mm , 三种工艺带来的密度差异还是比较明显的 , 虽然RTX30系列没有用上7nm工艺 , 但是三星8nm工艺对比台积电12nmFFN工艺带来的提升还是非常显著的 。
NVIDIA最终选择三星8nm工艺可能也有运行频率上的考量 , RTX3080在拥有比RTX2080Ti翻倍的CUDA核心数的情况下 , 仍能获得更高的Boost核心频率 , 而目前的7nm工艺可能还没法做到这一点 , 用在超算卡的GA100则不需要太高的运行频率 , 此外 , 不选择台积电7nm工艺可能也有产能方面的考量 。
台积电|全面升级带来性能暴涨 Ampere 架构新特性看这里
文章图片

文章图片

制程工艺的升级还带来了能效比方便的提升 , NVIDIA官方宣称在同样的60FPS帧率时 , Ampere架构显卡的能耗比可以达到Turing架构显卡的1.9倍 , 要实现同样的性能表现 , 前者只需120W多点的功耗 , 而后者则要240W的功耗 , 并且前者的还温度低了3°C , 噪音也减少了2dB , 这个提升还是非常可观的 。
GDDR6X显存加持 , 为极致性能保驾护航
RTX3090和RTX3080用上了全新的全新的GDDR6X显存 , 这也是RTX30显卡的性能表现得到大幅提升的重要因素之一 , 特别是在高分辨率、高光追特效等应用场景下 , 显存的容量和带宽都很容易成为显卡性能的瓶颈 。
台积电|全面升级带来性能暴涨 Ampere 架构新特性看这里
文章图片

文章图片

尤其是在发布会演示的8K@60Hz+全光追特效这种极限应用场景下 , 性能更加强悍的GDDR6X显存可以让Ampere架构处理器更好地释放性能 。
台积电|全面升级带来性能暴涨 Ampere 架构新特性看这里
文章图片

文章图片

GDDR6X除了在GDDR6对运行频率进行超频 , 最重要的改进就是首次在显存上使用了PAM4编码 。
台积电|全面升级带来性能暴涨 Ampere 架构新特性看这里
文章图片

文章图片

相比传统的"NRZ"编码方式 , PAM4编码可以让显卡在每个时钟周期内传输更多数据(从原来的每个时钟周期发送两位二进制数据 , 升级为每个时钟周期发送四位二进制数据) , 这也让GDDR6X的最大显存频率从GDDR6的16Gb/s提升到21Gb/s , 也拥有超过1TB/s(1050MB/s)的理论显存带宽上限 , 这个表现已经达到HBM2的1TB/s带宽的水平 。


推荐阅读