计算机视觉■推动计算机视觉和视觉AI发展的四大关键趋势( 三 )


在微软Kinect游戏机外设首次亮相8年后 , 现在3D相机模块已经准备好部署在成本和功率敏感的应用中 。计算机视觉开发者正在对3D传感采取积极行动和积极预测 。EVA最近的调查显示 , 近30%的开发者已经在使用3D传感 , 26%的开发者计划近期内在其项目中采用3D传感功能(见图6) 。
计算机视觉■推动计算机视觉和视觉AI发展的四大关键趋势
文章图片

文章图片

图6:55%的受访开发者表示 , 他们已经开始使用或计划近期在他们的计算机视觉项目中加入3D传感技术 , 该比例比去年增加了4% 。(来源:EVA)
趋势三、更好的处理器
推动强大而广泛的视觉感知可部署性的最重要因素 , 是更好的处理器 。“更好”是指更高的性能、更低的成本、更低的功耗 , 以及其他关键因素的改进 。视觉算法对计算性能要求很高 , 各种嵌入式系统通常需要满足低成本和低功耗的要求 。在数字无线通信和以压缩为中心的消费视频设备等其他应用领域 , 芯片设计人员通过使用专用协处理器和加速器 , 获得高性能、低成本和低功耗的极具挑战性的组合 , 从而实现应用中最苛刻的处理任务 。然而 , 这些协处理器和加速器通常不能由芯片用户编程 。
在很多标准应用中 , 这种权衡通常是可以接受的 , 因为在这些应用中 , 不同设计者使用的算法具有很强的通用性 。然而 , 在视觉应用中 , 并没有标准来约束算法的选择 。此外 , 视觉算法发展迅速 , 并且变化频繁 。
因此 , 实现高性能、低成本、低功耗和可编程性的结合 , 是一项非常具有挑战性的工作 , 通常需要在异构计算体系结构中通过组合多种类型的处理器(CPU、GPU、FPGA、DSP等)来实现 。
基于机器学习的视觉处理 , 无论对于预先培训还是随后的推理任务而言 , 从计算和存储需求来看 , 都是资源密集型的工作 。幸运的是 , 视觉处理器正在以惊人的速度发展 , 一方面开发速度非常快 , 另一方面来自数量庞大且仍在增长的技术供应商方面的竞争压力 。例如 , 现在有50多家公司同时在为深度学习推理和/或训练开发处理器 。在过去的几年中 , 深度学习加速的处理能力 , 已经有了两个数量级的提升 , 这些性能的提升与多方技术进步相结合 , 将使处理器的处理能力呈指数级增长 。
EVA最近在开发者调查中收集的数据显示 , 深度学习专用处理器的采用显著增加;近1/3的受访者表示现在正在使用深度学习专用处理器 , 而两年前这一比例只有19%(见图7 , 由于调查对象要求标记所有他们的项目使用的处理器 , 所以总数超过100%) 。这种趋势尤其令人震惊 , 因为在几年前 , 深度学习专用处理器还根本不存在 。同样需要注意的是 , 其他处理架构通常用于各种视觉任务 。
计算机视觉■推动计算机视觉和视觉AI发展的四大关键趋势
文章图片

文章图片

图7:被调查的开发者在他们的计算机视觉设计中使用的多种处理结构 。(来源:EVA)
趋势四、软件和硬件的普及化
“普及化”意味着开发有效的计算机视觉系统和应用、以及大规模部署这些解决方案 , 正在快速变得越来越容易 。为什么?主要有以下三大原因:
第一、深度学习使非专家能够使用样本图像数据(与手工设计的代码相比)更容易地创建功能性视觉系统 。
第二、有了更高性能、更低成本的处理器和有效的开发工具 。
第三、作为边缘处理的辅助或替代 , 云计算越来越普遍 。
前两点已经讨论过 , 但第三点值得注意 。云计算作为基于边缘视觉处理方法的辅助(如果不是替代的话) , 正变得越来越普遍 。
“云vs边缘计算vs两者混合”的拓扑决策通常并不简单 , “正确”的答案因应用和公司的不同而不同 , 甚至同一公司内的不同项目之间也不同(见图8) 。


推荐阅读