埃尔法哥哥MAML-Tracker:用目标检测思路做目标跟踪?小样本即可得高准确率丨CVPR 2020( 二 )
本文插图
图3:算法流程
通过 MAML 算法训练出来的初始化参数具有收敛快、泛化性能好的优点 。 图4的可视化结果充分说明了这一点:仅仅经过1步梯度下降的更新 , 检测器就能收敛到一个不错的结果;更重要的是 , 它在测试图片上仍然能够工作得很好 。
本文插图
图4:测试结果
训练过程与实验结果
解决了小样本学习的问题 , 检测器模型就能够自然地应用在跟踪任务上 。
第一步 , 挑选一个目标检测模型 。 MAML 算法对具体模型是没有要求的 , 只需要满足可用梯度下降更新的条件即可 。
第二步 , 使用 MAML 算法 , 对该目标检测模型进行预训练 , 找到一组较好的初始化的参数 。
第三步 , 每输入一段视频 , 根据用户在第一帧上指定的跟踪目标 , 构造训练数据 , 并用这个训练数据来训练目标检测模型 。 我们把这一步称之为域适应(Domain adaptation).
第四步 , 对于后续的每一帧图片 , 用训练好的检测器去预测跟踪目标的位置 。
在实验的过程中 , 我们选择了 RetinaNet 和 FCOS 作为目标检测模型 。 它们分别是 Anchor-based 以及 Anchor-free 两种类型检测器的代表性工作 。 在 MAML 预训练初始化参数的过程中 , 我们还加入了一些额外的技巧来辅助训练 。 例如可学的学习率(Learnable learning rate)、多步梯度优化(Multi-step loss optimization)、梯度一阶近似(First-order approximation)等等 。 这些技巧能够有效地稳定训练过程 , 提高模型的表达能力 。 感兴趣的读者可以参阅原始论文中的细节部分 。
我们在实验中惊讶地发现 , 通过这种简单的方式将检测器应用于目标跟踪 , 已经能够取得不错的效果 。 在 OTB-100、VOT-18 等多个数据集上 , MAML 预训练的检测器与普通 SGD 预训练的检测器(记为 Baseline)进行了详细的对比 , 结果如表1所示 。 在做 Domain adaptation 之前 ,Baseline 和 MAML 的性能都比较低 , 这是因为此时还没有学到任何跟目标物体相关的信息 。 经过 Domain adaptation 之后 , baseline 的检测器性能有了小幅度的改善 , 而用 MAML 预训练的检测器则远远优于 domain adaptation 之前的结果 。 这充分说明了元学习的有效性 。
本文插图
表1:MAML 预训练的检测器与 Baseline 的对比结果
在实验中 , 我们还进一步探索了在线更新(online updating)策略的有效性 。 所谓在线更新 , 即利用之前跟踪的结果 , 收集训练数据 , 用来再次训练检测器 。 我们发现 , 通过在线更新的方式 , 能够进一步地提升跟踪的准确度 。 当然 , 正如表2所示 , 当在线更新检测器的分类分支(cls)或者回归分支(reg)的时候 , 均会带来效率上的降低 。
本文插图
表2:在线更新策略有效性的验证结果
我们将检测器模型应用于跟踪任务上 , 得到的准确率并不逊色于一些经过精心设计的跟踪器 。 在多个主流数据集上 , 我们均取得了超过或者接近当时最好跟踪器的性能 。 这些结果充分展示了“目标检测+小样本学习”这个框架的威力 。
近年来 , 目标跟踪技术的发展突飞猛进 , 在各大数据集的性能评测中有了长足的进步 。 一方面 , 目标检测技术的进步给跟踪器带来了不小的帮助 , 许多目标检测的优秀设计被应用到了跟踪领域 , 使物体坐标的预测更加精确 , 如 SiamRPN、SPM、SiamFC++ 等等 。 另一方面 , 不少工作深入研究了如何利用少量样本去学习一个可靠的目标物体表征 , 如 MDNet , MetaTracker , ATOM 等等 。 在这篇文章中 , 我们借鉴了这两个方向的研究 , 提出了一个简洁、统一而高效的框架“目标检测+小样本学习≈目标跟踪” , 希望能为目标跟踪的研究提供一个不一样的视角 。 在这个框架下 , 还有许多问题仍值得探索 , 例如采用更好的小样本学习算法、实例分割结合小样本学习等等 。 我们也将在未来的工作进一步发掘这一框架的潜能 , 打造一个更好、更快的目标跟踪算法 。
推荐阅读
- 「」儿童节就送阿尔法蛋学习手表,安全贴心又能学习
- -悟空哥哥-618年中大促力来袭,iQOO Neo3应该是你不容错过的5G手机
- 埃尔法哥哥面对用户需求与AI技术之间的不平衡,AI产品经理该如何做?
- 埃尔法哥哥谁说机器学习难?它在这朵云上就没有门槛
- 埃尔法哥哥Python基础语法之“数据应用”
- 埃尔法哥哥Bionumerics软件的多位点VNTR分析
- 埃尔法哥哥一个例子就能读懂大数据,原来数据分析能在这些行业里使用
- 埃尔法哥哥C++程序员的职业生涯规划
- 埃尔法哥哥数据规范之代码表
- 埃尔法哥哥U盘插在手机的充电器上会怎么样?为什么?
