机器之心CVPR2020夜间行人检测挑战赛两冠一亚:DeepBlueAI获胜方案解读


机器之心专栏来自深兰科技北京 AI 研发中心的 DeepBlueAI 团队在 CVPR 2020 夜间行人检测挑战赛中斩落了两个冠军、一个亚军 。 本文将介绍该团队的解决方案 。
近日 , 由 CVPR 2020 Workshop 举办的 NightOwls Detection Challenge 公布了最终结果 。 来自深兰科技北京 AI 研发中心的 DeepBlueAI 团队斩获了「单帧行人检测」和「多帧行人检测」两个赛道的冠军 , 以及「检测单帧中所有物体」赛道的亚军 。
机器之心CVPR2020夜间行人检测挑战赛两冠一亚:DeepBlueAI获胜方案解读
本文插图
机器之心CVPR2020夜间行人检测挑战赛两冠一亚:DeepBlueAI获胜方案解读
本文插图
本文将为大家介绍 DeepBlueAI 团队的解决方案 。
NightOwls 检测挑战赛简介
检测 RGB 摄像机拍摄的夜间场景图片中的行人 , 是一个非常重要但是未被充分重视的问题 , 当前最新的视觉检测算法并不能很好地预测出结果 。 官方 baseline 在 Caltech(著名行人检测数据集)上的 Miss Rate(越小越好)可以达到 7.36% , 但在夜间行人数据集上却只能达到 63.99% 。
夜间行人检测是许多系统(如安全可靠的自动驾驶汽车)的关键组成部分 , 但使用计算机视觉方法解决夜间场景的检测问题并未受到太多关注 , 因此 CVPR 2020 Scalability in Autonomous Driving Workshop 开展了相应的比赛 。
NightOwls Detetection Challenge 2020 共有三个赛题:单帧行人检测(该赛题与 2019 年相同)、多帧行人检测 , 以及检测单帧中所有物体(包括行人、自行车、摩托车三个类别):
Pedestrian Detection from a Single Frame (same as 2019 competition)
Pedestrian Detection from a Multiple Frames
All Objects Detection (pedestrian, cyclist, motorbike) from a Single Frame
赛题介绍
机器之心CVPR2020夜间行人检测挑战赛两冠一亚:DeepBlueAI获胜方案解读
本文插图
夜间行人数据集示例
Track 1: Pedestrian detection from a single frame
该任务只要求检测行人(对应 Ground truth 中 category_id = 1 的行人类别) , 且所用算法只能将当前帧用作检测的输入 , 该题目与 ICCV 2019 NightOwls 挑战赛相同 。
Track 2: Pedestrian detection from multiple frames
该任务的要求与任务 1 相同 , 都是只检测行人 , 但是该任务允许使用当前帧以及所有先前帧 (N, N-1, N-2, …) 来预测当前帧的行人 。
这两个任务的数据集由 279000 张全注释的图片组成 , 这些图片来源于欧洲多个城市黎明和夜间的 40 个视频 , 并涵盖了不同的天气条件 。
模型效果评估使用的是行人检测中常用的指标Average Miss Rate metric , 但是仅考虑高度 > = 50px 的非遮挡目标 。
Track 3: All Objects Detection (pedestrian, cyclist, motorbike) from a Single Frame
该任务要求检测出帧里所有在训练集中出现过的类别 , 包括自行车、摩托车 , 并且不允许使用视频序列信息 。
赛题难点
机器之心CVPR2020夜间行人检测挑战赛两冠一亚:DeepBlueAI获胜方案解读
本文插图
这次比赛的主要难点包含以下几个方面:
运动模糊和图像噪点
与常规检测数据集不同 , 该竞赛考虑到实际驾驶情况 , 所用数据是在车辆行进过程中采集的 , 所以当车速较快或者有相对运动的时候会产生持续的运动模糊图像 。 并且由于摄像头是普通的RGB相机 , 因此在光线较弱的环境下收集的图片质量大幅度下降 , 这也是影响模型效果的主要原因 。
对比度差异大 , 色彩信息少
这是由于收集数据主要来自于夜间环境所导致的必然结果 , 所以在进行数据增强的时候需要谨慎 , 不同增强方式会造成较大的影响 。


推荐阅读