敌方已团灭!锐龙 9 5900X、锐龙 7 5800X首测( 二 )


敌方已团灭!锐龙 9 5900X、锐龙 7 5800X首测
本文插图
总体来说 , Zen 3架构的整数运算单元虽然和Zen 2架构保持一致 , 但调度灵活性和寄存器指令队列长度有所提升 , 增加了同一个时钟周期可执行的并行运算和发射数 。
敌方已团灭!锐龙 9 5900X、锐龙 7 5800X首测
本文插图
浮点单元部分 , Micro-Op Dispatch(微操作分发器)从4个通道提升至6个通道 , 可从前端接收6个微操作送入物理寄存器中 , 在Zen 2架构中MUL(乘法运算器)和ADD(加法运算器)还需要执行储存和寻址的工作 , 在Zen 3架构则设计了独立的F2I/Store单元 , 用于储存和寻址的工作 , 等于释放了更多的MUL(乘法运算器)和ADD(加法运算器)用于计算 , 同时FMAC乘积运算器的延迟再度降低1个周期 。
敌方已团灭!锐龙 9 5900X、锐龙 7 5800X首测
本文插图

敌方已团灭!锐龙 9 5900X、锐龙 7 5800X首测
本文插图
前边说了这么多 , 其实说白了就是为了提高处理器的运算吞吐量 , 吞吐量提升了 , 各缓存级的数据搬运效率也得对应提升 , 因此存取单元也是改进较大的地方 。 存取队列从48个条目升级至64个条目 , L1 32KB数据缓存每个时钟周期可以执行3次载入操作和2次储存(输出到上级单元)操作 , 如果是256Bit的数据 , 则降为2次和1次(与Zen 2相同) 。 在移动短字符串数据时 , Zen 3架构能获得更高的带宽和灵活性 。 另外TLB Walkers也从2个增加到了6个 , 如果按比例计算 , 是Zen 2架构的3倍 。 TLB Walkers是一个寻址单元 , 用来辅助TLB(页表缓存)在出现缓存Miss时 , 进行下级的虚拟地址/物理地址转换和寻址 , 用于提升缓存效率 。
敌方已团灭!锐龙 9 5900X、锐龙 7 5800X首测
本文插图

敌方已团灭!锐龙 9 5900X、锐龙 7 5800X首测
本文插图
最后最重要的自然是CCX结构的变化 , Zen 3架构将CCX的4个物理核心+16MB三级缓存设计翻倍成了8个物理核心+32MB三级缓存设计 。 有的玩家可能会说''不就是把两个CCX合在一起嘛 , 有什么区别?'' 。 实际上 , CCX结构的变化有2个重要的提升 , 其一是对于CCX里的每个核心来说 , 能直接访问的三级缓存从16MB翻倍到了32MB 。 当处理器里的某个核心在L1和L2出现miss时 , 就要去L3找数据 , 以往单个CCX里的L3缓存只有16MB , 而现在升级成了32MB 。 其二 , Zen 2架构的核心如果L1、L2缓存出现miss , 并在另一个CCX的L3中出现tag , 那就需要通过IF总线连接到另外一个CCX中调用L3缓存里的数据 , 一来一回无形中增大了核心的延迟以及降低了效率 。 在Zen 3架构中则没有这个情况 , 8个核心在一个CCX中 , IF总线连接的就是IO Die和另外一个CCD , 降低了核心延迟 , 提升三级缓存的使用效率和相应时间 。
敌方已团灭!锐龙 9 5900X、锐龙 7 5800X首测
本文插图
在架构层面 , Zen架构到Zen 2架构再到Zen 3架构 , 每一代处理器架构都经过AMD的精细改良 , 从Zen架构到Zen 2采用了翻倍的缓存设计、 缓存一致性的结合、全新的分支预测器和256bit乘积运算器以及最关键的MCM多芯片封装设计;再从Zen 2架构到Zen 3架构的每核心可访问L3缓存翻倍、分支预测功能的再度提升、缓存结构的再度优化 , 执行单元每时钟周期执行效率的优化 , 所谓''细微处见真章'' , Zen 3这一代架构或许没有Zen 2架构那样大刀阔斧的架构改革 , 但却是精雕细琢的精品之作 。


推荐阅读