新智元|Google的“泛芯片”科技蓝图( 二 )


进一步看所谓「Paradigm Shift」 , 它会带来巨大的收益 , 同样也意味着着我们必须付出巨大的代价 , 即需要设计「significantly different systems」 。 由于整个软硬件基础设施的复杂性和不灵活性 , 要进行「Paradigm Shift」当然不是说说这么简单 。
新智元|Google的“泛芯片”科技蓝图
本文插图

新智元|Google的“泛芯片”科技蓝图
本文插图

source: DeepMind@Hot Chips 2020
同时 , 硬件的多样性也会带来很大的软件移植开销 。
新智元|Google的“泛芯片”科技蓝图
本文插图

新智元|Google的“泛芯片”科技蓝图
本文插图

source: DeepMind@Hot Chips 2020
当然 , 好消息是 , AI应用本身的特征 , 在一定程度上简化了问题 。 到此 , 其实就是我们这几年面向AI应用优化系统和芯片的一个基本逻辑:应用的需求驱动计算范式的转变 , 而应用的特征使这种转变成为可能 。 这后面Dan Belov还给出了一些其它的机会 , 比如编译技术(MLIR)和把AI用于编译优化等等 , 感兴趣的朋友可以去看看 , 我就不赘述了 。
TPU引发的EDA试验
我这几年一直有一个观点 , 就是AI芯片的热潮带来很多side effect , 大大促进的相关技术和产业的发展 。 Google在做TPU的过程中 , 除了芯片和软件栈(XLA/MLIR等等)的探索 , 也涉及到了芯片设计工具和方法学 。
首先是一个大家可能都听过的新闻:「Google用AI设计芯片」 。 当然 , 这个说法有很多夸大的成分 , 这项工作更准确的说法是「Reinforcement Learning for Placement Optimization」 , 即用增强学习的方法进行布局(芯片设计流程中的后端设计的一个任务)优化 。 Jeff Dean在今年的ISSCC专门介绍了这项工作 。
【新智元|Google的“泛芯片”科技蓝图】
新智元|Google的“泛芯片”科技蓝图
本文插图

新智元|Google的“泛芯片”科技蓝图
本文插图

新智元|Google的“泛芯片”科技蓝图
本文插图

source: Jeff Dean@ISSCC 2020
关心更详细信息的朋友可以去看看[3] , 有这个项目的开发者的讲解和相关讨论 。
新智元|Google的“泛芯片”科技蓝图
本文插图

source: Azalia Mirhoseini and Anna Goldie @DAWN event1
作者Azalia Mirhoseini之前就尝试用增强学习来优化计算系统里的任务分配(Hierarchical Planning for Device Placement) , 我在之前的文章(ML + System = ?)中也提到过 。 这项工作本身只是解决芯片后端布局布线中的一个问题 , 并不像宣传的那么夸张 。
但这个工作是近几年「把AI用于EDA」这个大愿景里面的一个比较成功的例子 , 再加上Google的背景 , 所以受到很大关注 。 我还记得之前在一个EDA学者群里 , 对这项工作有过很热烈的讨论 。 当然 , 不管大家怎么评价 , Google应该还是会继续探索下去 。 毕竟Jeff Dean已经说了「AnywhereWe're Using Heuristics To Make a Decision」都是机器学习的用武之地 。
第二个可能会对芯片和EDA产业产生更深远影响的是Google所作的Cloud EDA尝试 , 这个我之前做过一个简单的分析 , 「为云而生又生于云中的芯片给我们的启示」 。 这中间的一个核心实践是利用cloud上近乎「无限」的资源进行芯片验证 , 可以大大加速芯片开发的时间 , 这可能也是TPU系列芯片能够相对快速迭代的原因之一 。 Cloud EDA最近的关注度也很高 , 下面这张slide , 介绍它的优势 , 来自Chips Alliance最近的一个workshop 。


推荐阅读