『GPU』GPU历史系列(四):通用GPU的来临( 四 )


6个月后的4月12日 , Nvidia终于(soft)通过GTX 470和480发布了它的第一个Fermi板卡 。 公司的裸片没有一个是全功能的 , 就像下面的GF104一样 , 因此Fermi的核心速度是相当保守的 , 以抑制功率使用和内存带宽较低 , 因为Nvidia对GDDR5 I/O缺乏经验 。
由于GF100 Fermi的芯片尺寸为529mm2 , 已经给AMD造成供应问题的台积电(TSMC)40纳米工艺的良率还达不到最佳水平 。 由于芯片尺寸 , 良率 , 功率要求和热量输出都密不可分 , Nvidia的400系列与AMD的产品相比 , 在游戏性能上付出了高昂的代价 。
Quadro和Tesla版的GF100在市场上几乎没有受到影响 , 如果有的话 , 这要归功于专业市场内部的一个现成的生态系统 。 此次发布没有让人失望的方面是引入了透明超级采样抗锯齿
(TrSSAA) , 它将与现场覆盖采样AA (CSAA)一起使用 。
虽然GTX 480的回应并不热烈 , 但英伟达的第二款Fermi芯片(GTX 460中的主流GF104)却取得了不朽的成功 。 它的性能很好 , 价格也很便宜 , 192bit/768MB的发行价格为199美元 , 256bit/1GB的发行价格为229美元 。 他们推出了大量的非参考和factory超频卡 , 由于Nvidia选择了保守的参考时钟来帮助降低功耗 , 因此有很大的超频空间 。
460的积极反应部分源于GF100上市后的低预期 。 据推测 , GF104的容量不超过GF100的一半 , 与AMD的Cypress GPU相比 , 其遭受的影响非常之大 。 这证明是错误的 。 当Nvidia在11月发布新版GF100 , 即GF110时 , 博客“专家”和AMD都感到了第二个惊喜 。
升级后的芯片实现了之前的芯片无法实现的功能 , 即实现了整个芯片的功能 。 最终得到的GTX 570和580是最初400系列的预期值 。
第一个AMD Northern Islands系列GPU Barts于10月问世 。 Barts是Evergreen的进一步发展 , 旨在降低Cypress裸片的生产成本 。 与大幅提升性能不同的是 , 该GPU的性能看起来与之前的HD 5830和HD 5850相当 , 但在GPU尺寸上大大节省了 。 AMD削减了流处理器(着色器)的数量 , 大修并减少了内存控制器的物理尺寸(以及相应的内存速度降低) , 并取消了执行双精度计算的能力 。 但是 , Barts确实在Evergreen上进行了细分升级 。
『GPU』GPU历史系列(四):通用GPU的来临
本文插图

虽然性能的提高并不显著 , 但AMD确实升级了显示技术的各个方面 。 DisplayPort被提升到1.2(从一个端口驱动多个监视器的能力 , 高分辨率显示器的120Hz刷新 , 以及比特流音频) , HDMI被提升到1.4a(3D 1080p视频播放 , 4K屏幕分辨率) , 公司还增加了一个支持DivX的更新视频解码器 。
AMD还通过引入形态抗锯齿(MLAA)改进了驱动程序特性集 , 这是一种后处理模糊过滤器 , 其功能(尤其是在启动时)非常成功或失败 。
HD 6970和HD 6950的推出为具有EQAA(增强质量AA)的Catalyst驱动程序增加了传统的AA模式 , 而AMD还实现了对HD3D的支持 , 这一次使用PowerTune进行了动态功耗分析 。
一般来说 , Cayman部件要比第一代Fermi芯片好 。 他们本来应该胜过他们 , 但比第二代(GTX 500s)落后了几个百分点 , 而且随后两个阵营的driver版本增加了进一步的差异 。
Cayman 11月的发布被推迟了一个月 , HD6970和6950于12月15日发布 , 它代表了与VLIW5体系结构的(短暂)背离 , 而VLIW5体系架构自R300系列以来一直在使用 。 该公司转而使用VLIW4 , 它在每个流处理块中删除了第五个特殊功能(或Transendental)执行单元 。
这是为了在DX9(及更早版本)游戏中撤回过多的资源 , 同时对图形管道进行更加面向计算的重组 。
Trinity和Richland系列APU的集成显卡是VLIW4的唯一其他部件 , 而AMD最新的显卡体系结构基于GCN(Graphics Core Next) , 而VLIW5则作为入门级Evergreen GPU的品牌保留在HD 8000系列中 。


推荐阅读