半导体行业观察■Chiplet最强科普( 七 )


然而 , 由于使用SerDes减少了对线数的要求 , 因此可以使用更便宜的玻璃甚至有机基板来构建大型多芯片封装 。 使用这些基板降低了总的封装开发成本 。
chiplet间数据传输协议 在大多数加速应用程序中 , 在一个多chiplet产品中 , 在多个chiplet上数据路径可能同时运行执行 。 多个chiplet通过数据传输协议共享数据 。 相干协议使用硬件支持为软件开发人员在主机和DSA上提供一致的内存状态 。 提供这种一致性的成本与需要实现这种一致性的物理区域成比例 。 在非常大的范围内 , 实现一致性的延迟成本可能非常大 , 程序员对这种延迟的直接控制非常有限 。 有几种用于加速器状态一致性的开放协议 , 包括CCIX、TileLink和OpenCAPI 。
非相干数据结构是相干协议的替代方案 。 在具有非相干结构的系统中 , 开发人员显式地控制数据传输 。 TensorFlow是使用非相干数据传输的加速器的一个例子 。 为chiplet开发非相干数据结构有两种选择 。 一种选择是扩展片内结构以进行片外传输 。 大多数片上结构使用同步全局总线 。 这些总线不容易扩展到芯片外 。 第二种选择是使用片对片的非相干数据传输协议进行片对片的数据传输 。 PCI Express是最常见的片间非相干数据传输协议 。 但是 , 在封装中使用它的开销可能很大 。 Netronome开发了一种用于非相干数据传输的轻型可伸缩结构技术实施证明要点
本节回顾了原型中使用的先进技术的证明点 。 具体来说 , 我们讨论了USR SerDes、基底和非相干数据传输协议的实现 。 下文将讨论ODSA的原型实现 。
超短距离SerDes 在过去的几年中 , 出现了一种使用硅中介层或硅衬底的重要替代方案 。 这种选择是低成本基底和高能效USR SerDes的组合 。 这些USR SerDes的出现 , 特别是Kandou使用CNRZ-5调制技术的Glasswing SerDes的出现 , 使得可以在大型MCM上构建复杂的系统 。 CNRZ-5调制技术提供了NRZ形的接收眼 , 因此即使在高速率下也可以使用最小的均衡 , 从而降低了功率 。
(1)在有机基质上的调制-CNRZ-5 vs PAM-4 vs NRZ
选择在有机封装上运行的SerDes上使用的调制技术非常重要 。 三个相关的选择是CNRZ-5 , PAM-4和NRZ 。 在基底上使用PAM-4调制技术是一个糟糕的选择 , 因为它具有糟糕的本机错误性能 , 必须通过显著的、有时是高延迟的前向错误控制(FEC)块和/或大型大功率均衡器来保护 。 这种糟糕的本机性能的原因是PAM-4在同一链接上的“眼图”有大眼睛和小眼睛的组合 , 这是PAM-4的三个堆叠的眼睛的结果 。 来自大眼睛的能量反射到任何缺陷和接收器上 。 这种反射的能量会使小眼睛闭上 。 反射是USR/XSR链路的主要缺陷 。 非反射符号间干扰(ISI)也存在类似的影响 。
PAM-4被下一代的XSR-SerDes所使用 , 这些SerDes正被开发用于光学模块应用 。 在这种应用中 , 一个大的系统FEC是用来保护光链路的 , 所以它是免费提供给直接将数据传送到光学链路上的电子链路的 。 在几乎所有其他应用程序中 , 重要的FEC块都需要与链接一起使用 。 这意味着他们通常需要增强均衡和FEC 。 OIF CEI-56G-XSR-PAM4互操作性协议的误码率是1E-9 。
NRZ USR Phys功能强大 , 通常可以在没有FEC的情况下使用 。 在相同的波特率下 , NRZ PHY的pin效率低于CNRZ-5 PHY 。 由于可用的裸片球数量有限 , 因此pin效率在USR应用中至关重要 。 降低的pin效率直接降低了使用NRZ的裸片的边缘带宽 。 也就是说 , 市场上有25Gb / s NRZ USR PHY , 目前有多家供应商正在开发50Gb / s NRZ USR PHY 。
(2)Kandou的chiplet USR证明点
GW16-500 Quad Glasswing Phy是首批利用和弦信号的PHY , 这是一种创新的PHY技术 。 Glasswing使用CNRZ-5 和弦信号 , 这是一种信号形式 , 适合单端和差分信号之间的空间 。 和弦信令可以通过以更低的功耗和更少的pin获得更多的比特 , 从而使几乎每个接口都变得更好 。


推荐阅读