英特尔|对话英特尔宋继强:智能边缘计算开启架构创新的辉煌十年( 二 )


【英特尔|对话英特尔宋继强:智能边缘计算开启架构创新的辉煌十年】英特尔|对话英特尔宋继强:智能边缘计算开启架构创新的辉煌十年
文章图片

文章图片

车路协同、机器人是当前非常典型的两个智能边缘的应用场景 。宋继强以机器人为例介绍 , 英特尔中国研究院当前在该领域主要有两大方向:一是把边缘计算引入智能机器人的场景中 , 提高机器人的学习能力;二是提高多机器人之间的协同工作能力 。攻克了这两大挑战 , 能够更好地将机器人用在商用场景、医院场景 , 以及工业物流和仓储等场景 。
因为在机器人的学习能力方面 , 它如果要具备长期的、并且可以逐步提高的服务能力 , 就需要从场景中逐渐学习、构造对场景的理解 。在此基础上 , 要进一步分析场景中的相互关联 , 形成机器人自己的记忆 , 才能进行后续的能力提升 。但是 , 本身靠机器人自己完成的话 , 对硬件的要求太高 , 这就需要用到边缘计算 , 一方面将不需要即时响应的计算卸到边缘计算上 , 另一方面也可以利用边缘计算进行存储 。通俗地说 , 智能边缘就相当于让机器人这类小型前端设备 , 能够具备更大的存储和计算容量 。
在协同工作方面 , 由于每个机器人都是一个物理的个体 , 它所观察到的都还是局部空间 , 要实现一个更加完整的、应用级别的规划时 , 通常需要全局的调度能力 , 这时边缘计算就是很好的方式 , 它实时性好 , 能够高速调度机器人之间的互相协作 , 能够在机器人具备局部自主能力的同时 , 又克服了它是一个物理实体的局限性 。
据了解 , 英特尔中国目前已经开始构建场景中的知识图谱 , 相当于为机器人构建记忆 , 支持它逐渐学习 , 甚至进行任务规划 。
超异构计算成为关键驱动力
来自端侧的应用需求千差万别 , 大量的数据和处理需求 , 有的要实时 , 有的要稀疏 , 有的要并行 , 有的需要矩阵 。有这么多种不同的计算同时发生 , 而且要形成一个闭环 , 满足一定的实时性要求;这么多架构要同时存在 , 并且要无缝融合 , 带宽、体积和成本都要尽量优化 。
因此也可以说 , 一个架构“包打天下”的时代已经过去了 。“架构创新的辉煌十年 , 超异构计算将成为关键的创新驱动力” , 宋继强表示 。也正是如此 , 英特尔强调其 XPU 架构的价值 , 这个“X”指的是至少会包含 CPU、GPU、专用加速器以及 FPGA 的混合架构 , 至于选择哪种架构 , 则是与应用强相关的 。
不过 , 要真正获得硬件异构之后的超级性能提升 , 没有好的软件是不行的 , 宋继强认为 , 英特尔的 oneAPI 实际是在为业界搬一块大石头 。
这样说的依据何在?他表示 , 不同架构上的编程人员分布非常不均匀 , CPU 最多 , GPU 也不少 , 但能在 FPGA 上编程的人 , 一下就少了很多 , 到 ASIC 就更有针对性了 。未来架构中常常会有异构的情况 , 却没有办法让一个程序员学会所有东西 。
oneAPI 就是英特尔搭建软件生态的一个实践 。作为跨 XPU 架构统一编程模型 , oneAPI 包含工具链、性能库、编译器、调试、编程、程序移植等 , 可以帮助开发人员有效减少跨架构程序开发时间和成本 。
“架构和软件是要搭配的 , 架构要体现出不同的架构都能玩得转 , 同时做出来的硬件还要能让别人用软件快速使用 。如果新的架构出来 , 没有一个很好的软件能够把它生态化 , 那就还是起不来” , 宋继强强调 。
智能边缘需要更多元、灵活的设计策略
今天的数据复杂度和产品设计周期都与以往大有不同 , 英特尔最新提出的“分解设计”策略尤为适用 。特别是在边缘侧 , 能够应对未来异构计算的大趋势 。
宋继强表示 , 英特尔其实一直有分解设计的尝试 , 这次将它专门作为一个策略提出 , 意在强调通过多节点的产品或 IP , 能够快速完成产品构造 , 满足当前的应用需求 。这是一种“化整为零”的设计思路 , 例如把原来的整个 SoC 芯片由大变小 , 先做成几个大的部分 , 比如 CPU、GPU、I/O , 再将 SoC 的细粒度进一步提升 , 将以前按照功能性组合的思路 , 转变为按照晶片 IP 进行组合 。


推荐阅读