埃尔法哥哥 2020,MAML-Tracker:用目标检测思路做目标跟踪?小样本即可得高准确率丨CVPR( 二 )


埃尔法哥哥 2020,MAML-Tracker:用目标检测思路做目标跟踪?小样本即可得高准确率丨CVPR
文章图片
图3:算法流程
通过MAML算法训练出来的初始化参数具有收敛快、泛化性能好的优点 。 图4的可视化结果充分说明了这一点:仅仅经过1步梯度下降的更新 , 检测器就能收敛到一个不错的结果;更重要的是 , 它在测试图片上仍然能够工作得很好 。
埃尔法哥哥 2020,MAML-Tracker:用目标检测思路做目标跟踪?小样本即可得高准确率丨CVPR
文章图片
图4:测试结果
训练过程与实验结果
解决了小样本学习的问题 , 检测器模型就能够自然地应用在跟踪任务上 。
第一步 , 挑选一个目标检测模型 。 MAML算法对具体模型是没有要求的 , 只需要满足可用梯度下降更新的条件即可 。
第二步 , 使用MAML算法 , 对该目标检测模型进行预训练 , 找到一组较好的初始化的参数 。
【埃尔法哥哥 2020,MAML-Tracker:用目标检测思路做目标跟踪?小样本即可得高准确率丨CVPR】第三步 , 每输入一段视频 , 根据用户在第一帧上指定的跟踪目标 , 构造训练数据 , 并用这个训练数据来训练目标检测模型 。 我们把这一步称之为域适应(Domainadaptation).
第四步 , 对于后续的每一帧图片 , 用训练好的检测器去预测跟踪目标的位置 。
在实验的过程中 , 我们选择了RetinaNet和FCOS作为目标检测模型 。 它们分别是Anchor-based以及Anchor-free两种类型检测器的代表性工作 。 在MAML预训练初始化参数的过程中 , 我们还加入了一些额外的技巧来辅助训练 。 例如可学的学习率(Learnablelearningrate)、多步梯度优化(Multi-steplossoptimization)、梯度一阶近似(First-orderapproximation)等等 。 这些技巧能够有效地稳定训练过程 , 提高模型的表达能力 。 感兴趣的读者可以参阅原始论文中的细节部分 。
我们在实验中惊讶地发现 , 通过这种简单的方式将检测器应用于目标跟踪 , 已经能够取得不错的效果 。 在OTB-100、VOT-18等多个数据集上 , MAML预训练的检测器与普通SGD预训练的检测器(记为Baseline)进行了详细的对比 , 结果如表1所示 。 在做Domainadaptation之前 , Baseline和MAML的性能都比较低 , 这是因为此时还没有学到任何跟目标物体相关的信息 。 经过Domainadaptation之后 , baseline的检测器性能有了小幅度的改善 , 而用MAML预训练的检测器则远远优于domainadaptation之前的结果 。 这充分说明了元学习的有效性 。
埃尔法哥哥 2020,MAML-Tracker:用目标检测思路做目标跟踪?小样本即可得高准确率丨CVPR
文章图片
表1:MAML预训练的检测器与Baseline的对比结果
在实验中 , 我们还进一步探索了在线更新(onlineupdating)策略的有效性 。 所谓在线更新 , 即利用之前跟踪的结果 , 收集训练数据 , 用来再次训练检测器 。 我们发现 , 通过在线更新的方式 , 能够进一步地提升跟踪的准确度 。 当然 , 正如表2所示 , 当在线更新检测器的分类分支(cls)或者回归分支(reg)的时候 , 均会带来效率上的降低 。
埃尔法哥哥 2020,MAML-Tracker:用目标检测思路做目标跟踪?小样本即可得高准确率丨CVPR
文章图片
表2:在线更新策略有效性的验证结果
我们将检测器模型应用于跟踪任务上 , 得到的准确率并不逊色于一些经过精心设计的跟踪器 。 在多个主流数据集上 , 我们均取得了超过或者接近当时最好跟踪器的性能 。 这些结果充分展示了“目标检测+小样本学习”这个框架的威力 。
近年来 , 目标跟踪技术的发展突飞猛进 , 在各大数据集的性能评测中有了长足的进步 。 一方面 , 目标检测技术的进步给跟踪器带来了不小的帮助 , 许多目标检测的优秀设计被应用到了跟踪领域 , 使物体坐标的预测更加精确 , 如SiamRPN、SPM、SiamFC++等等 。 另一方面 , 不少工作深入研究了如何利用少量样本去学习一个可靠的目标物体表征 , 如MDNet , MetaTracker , ATOM等等 。 在这篇文章中 , 我们借鉴了这两个方向的研究 , 提出了一个简洁、统一而高效的框架“目标检测+小样本学习≈目标跟踪” , 希望能为目标跟踪的研究提供一个不一样的视角 。 在这个框架下 , 还有许多问题仍值得探索 , 例如采用更好的小样本学习算法、实例分割结合小样本学习等等 。 我们也将在未来的工作进一步发掘这一框架的潜能 , 打造一个更好、更快的目标跟踪算法 。


推荐阅读