程序员如何学习计算机视觉?你需要了解这五大技术!( 五 )


文章插图
 
另外,当在原始 Faster R-CNN 架构上运行且没有做任何修改时,感兴趣池化区域( RoIPool ) 选择的特征映射区域或原始图像的区域稍微错开 。由于图像分割具有像素级特性,这与边界框不同,自然会导致结果不准确 。Mas R-CNN 通过调整 RoIPool 来解决这个问题,使用感兴趣区域对齐( Roialign )方法使其变的更精确 。本质上,RoIlign 使用双线性插值来避免舍入误差,这会导致检测和分割不准确 。
一旦生成这些掩码,Mask R-CNN 将 RoIAlign 与来自 Faster R-CNN 的分类和边界框相结合,以便进行精确的分割:

程序员如何学习计算机视觉?你需要了解这五大技术!

文章插图
 
结语上述这 5 种主要的计算机视觉技术可以协助计算机从单个或一系列图像中提取、分析和理解有用的信息 。你还可以通过我的 GitHub 存储库(https://github.com/khanhnamle1994/computer-vision)获取所有的演讲幻灯片以及指南 。
作者 | James Le原文链接https://heartbeat.fritz.ai/the-5-computer-vision-techniques-that-will-change-how-you-see-the-world-1ee19334354b

【程序员如何学习计算机视觉?你需要了解这五大技术!】


推荐阅读