|2 倍 RTX 2080 Ti 性能 RTX 3090 1 万多个核心怎么来的?老黄变戏法
NVIDIA的RTX30系列显卡今天凌晨发布了 , 旗舰RTX3090显卡虽然价格涨到了1.2万元 , 但是性能比RTX2080Ti翻倍 , 简直是开挂一样 。
就跟2018年图灵GPU发布时一样 , 老黄这次在发布会上再次强调安培GPU是有史以来性能提升最大的一次 , 这点上也没错 , 毕竟显卡性能翻倍是这10年来都少见的 。
RTX3090显卡是怎样做到性能翻倍的?除了第二代RT单元、第三代Tensor单元之外 , CUDA核心数也猛增到了10496个 , 要知道RTX2080Ti也不过4352个 。
文章图片
文章图片
CUDA核心数一下子从4000+翻倍到了10000+ , 这规模提升也太恐怖了 , NVIDIA到底是怎么做到的?
特别是在发布之前 , 连AIC显卡厂商拿到的数据都显示RTX3090是5248个CUDA核心而已 , 怎么就一下子翻倍了?
现在NVIDIA还没公布安培GPU的架构 , 具体如何还不好说 , 不过我们可以分析下几种可能 。
文章图片
文章图片
上面是7nm安培GA100的架构图 , 每组SM单元中有64个INT32单元、64个FP32单元及32个FP64单元 。
8nm安培游戏GPU跟A100主要架构应该差不多 , 但是不需要多少FP64单元 , 多了RTCore光追单元 。
所以第一种FP32单元翻倍的可能就是——A100中的FP64单元被游戏GPU中的FP32取代了 , 这样带来额外一倍的FP32单元 。
不过算起来简单 , 实际上就不好说了 , 因为A100是7nm工艺 , 核心面积依然有826mm , 安培游戏GPU才8nm工艺 , 晶体管密度更低 , 280亿只有A100的540亿的一半 , 核心面积会小很多 , 还要加上RTCore单元 , 所以这种可能性非常小 。
文章图片
文章图片
第二种可能在推上有人分析过 , 那就是游戏GPU不仅砍掉了FP64单元 , 同时还做到了INT32单元跟FP32一样的功能——可以同时计算整数或者浮点 , 这样一来64个INT32摇身一变也是FP32单元了 , 直接数量翻倍 。
这个可能性比较大 , 也是NVIDIA之前称CUDA核心数是5248个 , 临到头改成10496个的合理解释了 。
【|2 倍 RTX 2080 Ti 性能 RTX 3090 1 万多个核心怎么来的?老黄变戏法】当然 , 最后一种可能就是阴谋论了 , 老黄并没有做到1万多个FP32 , 就是马甲忽悠——不过真要是这么做 , 以后会有法律麻烦 , 老黄不会这么轻易让人抓到把柄的 。
总之 , 在没有官方公布的细节之前 , 1万多个CUDA核心的由来比较迷 , 但不论那种解释 , NVIDIA肯定是技术上可以做到 , 否认也不会有如此大的性能提升了 。
文章图片
文章图片
推荐阅读
- iQOO手机|畅爽游戏,极速充电!iQOO 5 Pro定义性能旗舰新标准
- iQOO手机|iQOO 5不只是性能“怪兽”,极致视听同样深得用户芳心
- 中关村在线|颜值性能同时在线 1MORE ComfoBuds真无线耳机
- cnBeta|早期骁龙875基准测试:单核性能慢于A13 Bionic多核结果略胜一筹
- 5G|总投资60亿元,高性能5G通讯项目签约落户江西抚州
- 中关村在线|OTA升级狂魔带来惊喜 魅族17性能和影像体验报告
- 中关村在线|硬件百科:硬盘性能影响后期剪辑么?
- OPPO手机|5G手机别乱买,3款机型不要碰,高价低配性能落伍
- |升级“真香”的 RTX 30 系显卡后,你能得到什么?
- 5G手机|5G手机别乱买,3款机型不要碰,高价低配性能落伍
