AI人工智能|对象检测技术如此混乱,如何更清晰地厘清各类目标检测复杂概念( 二 )
文章图片
文章图片
两阶段检测器的区域建议
准备好我们感兴趣的区域后 , 我们可以对它们进行逐一处理 , 得出它们各自的类别以及用于最终修剪的置信度得分 。结果如下:
文章图片
文章图片
两级检测器结果
现在 , 我们得到了出色的检测 , 几乎没有混乱 。与一阶段方法相比 , 该技术使用专用网络进行区域建议和区域分类 。这个想法允许两个阶段都可以独立开发 , 从第一阶段到第二阶段 , 为了进行更快的检测 , 已经进行了大量工作来共享见解 。
这种方法的明显优势是它的准确性 。通过将位置与分类分离 , 两个任务都由专门的网络处理 。另一方面 , 速度较慢 , 因为需要中间区域投标步骤 , 并且需要为每个投标运行分类器网络 。因此 , 所花费的时间与检测次数成正比 。训练可变大小的输出
现在我们知道了如何处理输出大小问题 , 最后一个问题是 , 我们如何训练这样的网络 。值得庆幸的是 , 在两种情况下 , 该过程大致相同 。
训练对象检测算法就像抚养孩子一样 。你必须告诉孩子对与错 。但是 , 如果称赞或抱怨太多 , 最终将宠坏或伤害孩子 。用检测术语 , 我们只会赞扬最好的发现 , 只会惩罚最坏的错误 , 而其余的则什么也没说 。
考虑到真实边界框的集合 , 我们将奖励具有大于0.7"交集"(IoU)的框 , 并惩罚低于0.3的检测 。这将创建一个梯度信号 , 重点放在真正好的检测上 , 淡化唯一真正错误的检测 , 剩下其余的 。
可以添加的一件简单的事情是IoU仅在0.1到0.3之间的淡化检测 。因此 , 惩罚性有所降低 。还可以平衡考虑正数和负数的框数 , 以平衡正负样本的贡献 。
进一步的步骤是使用某种形式的硬负开采 。总体思路是利用模型的损失对检测结果进行从最坏到最好的排序 。这样 , 我们就有了更原则性的选择赞美和惩罚的方法 。检测与细分
到目前为止 , 我们一直在进行对象检测:为场景中的对象找到边界框 。对于人类而言 , 这是一项容易的任务:我们可以轻松地检测到事物 , 并且可以快速绘制矩形 。更具挑战性的任务是细分 。
图像分割是绘制一个概述对象的蒙版 。例如 , 我们需要完全绘制其轮廓 , 而不是围绕一个人的矩形 。这比较难 , 因为绘制对象实际轮廓比画矩形更难 , 并且事物也可以与背景融为一体 , 这使其更具挑战性 。
但是 , 对于神经网络 , 这更容易 。代替具有可变大小的输出 , 我们必须对每个像素进行分类 , 从而制作一个蒙版 。因此 , 每个输入像素需要一个输出像素 。这是由人员细分工具处理的上述场景之一的示例:
文章图片
文章图片
人群细分
它并不完全完美 , 但这是一项可爱的工作 。从概念上讲 , 这是一个困难得多的问题 。但是 , 在网络体系结构级别 , 它更易于管理 。
如果我们同时利用两个框架 , 我们可以快速获得所谓的"实例分割" , 这是将不同的对象与不同的对象进行分割的任务 , 例如:
文章图片
文章图片
实例分割示例
总体思路是分割每个边界框的结果 。这样 , 边界框就是"实例" , 而分段确实可以实现分段:) 。虽然这被简化 , 但这是Mask R-CNN算法背后的一般思想 。总结
推荐阅读
- 新科技嗅|人工智能可以应用在哪些方面
- 技术编程|人工智能在大视频运维中如何实现CDN硬盘故障预测?
- 新加坡|新加坡大学生人工智能创新大赛开幕式举行 星环科技提供建模平台
- AI人工智能|“眼健康黑科技” AI智能眼科检测仪来了!展锐虎贲T710开发板等你来盘!
- AI人工智能|非接触式测谎分析系统应用
- AI人工智能|错题打印机喵喵机P1彩色版,学习的多种打开方式
- AI人工智能,智能电视|康佳KKTV智能语音电视,找回自己的专属乐趣
- AI人工智能|人工智能技术助力民族语言保护大有可为
- AI人工智能|康佳KKTV智能语音电视,找回自己的专属乐趣
- 人民日报中央厨房|人工智能的职业替代或是多虑了
