Intel|英特尔下一个时代的“CPU”:10倍以上性能提升,1000倍能耗降低( 二 )


还有一个例子,一些早期的研究显示,热扩散方程(一个基本的物理行为属性)已经在Loihi中建模,桑迪亚国家实验室完成的这项研究极大地减少了科学计算存在功耗过大方面问题的可能性 。
“我们对Loihi的结果非常满意 。但与此同时,我们发现了硬件的一些限制 。”Mike同时指出 。
迈向下一个CPU时代
更强大的硬件
“我们有了一个编程性极强的神经元,可配置性极强的神经元模型,但它是一个固定功能类型的神经元 。”Mike进一步表示,“自然界没有单一的神经元,实际上有1000种不同类型的神经元,它们在大脑中有许多不同类型的动态 。我们想尝试支持的应用确实需要更多的灵活性,以使芯片中的神经元更加多样化 。”
雷锋网了解到,英特尔通过一个微码指令集来解决灵活性的问题,这个微码指令集定义了神经元模型,几乎可以编程任意的模型,涵盖了研究界试图探索的不同类型的方法 。
“我们还扩展了脉冲的概念,这将提升结果的精确度,还可以缩小网络的大小,以支持特定的问题 。”Mike介绍,“在功能上,我们在Loihi2上还加强了芯片的学习能力 。”
这些研究层面和功能层面的进步需要更强大的硬件支撑 。在电路层面,Loihi 2比Loihi 1快2到10倍,这取决于特定的瓶颈和你测量的特定参数 。例如,基于模拟的结果显示,在前馈神经网络中,Loihi2比Loihi快10倍 。
工作负荷层面,Loihi2的神经元的数量提升了8倍,同时将芯片的面积缩小了一半(芯片总内存大致相同),即基于核心大小为0.21 mm2的Loihi 2,最多支持 8192个神经元,对比核心尺寸为0.41 mm2的Loihi,最多支持1024个神经元 。
Intel|英特尔下一个时代的“CPU”:10倍以上性能提升,1000倍能耗降低
文章图片
Mike解释,“第一代Loihi做了固定分配,芯片中的每个核心都支持1024个神经元 。但我们发现,在许多应用中,神经元的数量是一个有限的因素,芯片中的其它内存资源却没有得到充分利用 。因此,Loihi 2的架构允许资源在有限的程度上进行交换,同时不影响架构的格式和效率,从而当应用工作负载受限于神经元数量时(通常会发生),能够提供更多的资源来扩展到更多的神经元 。”
与此匹配,需要先进的半导体制造工艺 。“神经拟态计算的架构相对于其他架构需要更大的资源密度,Intel 4制程能够提供更大的晶体管密度,我们可以在同样大小的芯片上放置更大的神经网络 。”Mike还说,
“与以往的制程技术相比,Intel 4制程节点采用的极紫外光刻(EUV)技术简化了布局设计规则,使Loihi 2的快速开发成为可能 。”
采用预生产版本的Intel 4制程其实还有英特尔展示其先进制程领导力的作用 。需要指出的是,神经拟态架构是一个非常同质的架构,这对于仍处于产量优化过程中的早期工艺来说有很大优势,因为它可以容忍大量的缺陷 。
“神经拟态架构比其他架构更能够从Intel4预生产过程中受益 。”Mike表示 。
不过,要解决更多实际问题还需要用Loihi2构建系统 。为此,Loihi2的扩展能力也进行了提升,有了4倍速度的接口,还新增了两个接口,可以在3个维度上进行扩展 。
Intel|英特尔下一个时代的“CPU”:10倍以上性能提升,1000倍能耗降低
文章图片
同时,Loihi2对芯片间的连接进行了压缩,让许多工作负载的扩展提供了10倍以上的带宽,在减少拥堵和该架构扩展到更大网络的能力方面,综合提高了60倍以上 。
Intel|英特尔下一个时代的“CPU”:10倍以上性能提升,1000倍能耗降低
文章图片
总体而言,Loihi2的诸多改进,是为了减少支持相同程度能力所需的网络规模,从而获得更快的处理速度和更低的功耗 。
软件是神经拟态芯片大规模商用的关键
“Loihi 2与第一代一样,属于通用的神经拟态架构 。展望未来,我们希望能构建一种新的可编程处理器架构,类似CPU或GPU,不针对特定的应用,适合用于填充组合技术 。”Mike展望 。
纵观成功的CPU和GPU,都有非常易于使用软件及软件生态 。显然,神经拟态计算芯片想要成为像CPU一样的通用芯片,软件非常关键 。
Mike也说,“过去三年使用Loihi的过程,我们吸取到一个重要经验,软件对神经拟态领域进展的限制和硬件一样关键 。”
Intel|英特尔下一个时代的“CPU”:10倍以上性能提升,1000倍能耗降低


推荐阅读