Mosaic:YOLOv4来了,大型调优现场,速度和准确率俱佳( 二 )


Additional improvements 为了让模型能更好地在单卡进行训练 , 做了以下的改进:

  • 提出新的数据增强方法Mosaic和Self-Adversarial Training (SAT) 。
  • 使用遗传算法选择最优的超参数 。
  • 修改目前的方法来让训练和检测更有效 , 包括改进的SAM , 改进的PAN以及 Cross mini-Batch Normalization (CmBN)

Mosaic:YOLOv4来了,大型调优现场,速度和准确率俱佳
本文插图

Mosaic是新的数据增强方法 , 同时融合4张训练图片 , CutMix仅融合2张图片 , 使得目标的检测范围超出其正常的上下文 , 另外BN每次统计4张图片 , 这能显著地减少对大mini-batch的需要 。
Self-Adversarial Training(SAT)也提供新的数据增强手段 , 分为两个前向反向阶段 。 在第一阶段 , 先对图片进行前向计算 , 然后通过反向传播修改图片的像素 , 注意这里不修改网络的权重 , 通过这种方式 , 网络进行了一次对抗式训练 , 制造出没有目标的假象 。 在第二阶段 , 对修改后的图片进行正常的训练 。
Mosaic:YOLOv4来了,大型调优现场,速度和准确率俱佳
本文插图

CmBN是改进版的CBN , 仅统计single-batch中的mini-batch , 如图4所示 , 假设t-3~t为single-batch中的mini-batch , 若干single-batch中包含单个mini-batch , 则CmBN与BN一样 。
Mosaic:YOLOv4来了,大型调优现场,速度和准确率俱佳
本文插图

将SAM从spitial-wise attention修改为point-wise attention , 即输入和输出的大小一致 。
Mosaic:YOLOv4来了,大型调优现场,速度和准确率俱佳
本文插图

将PAN的shortcut连接方法 , 从相加改为concate 。
YOLOv4 YOLOv4包含:
  • Backbone:CSPDarknet53
  • Neck:SPP , PAN
  • Head:YOLOv3
YOLO v4使用:
  • 主干网络的BoF(Bag of Freebies):CutMix和Mosaic数据增强, DropBlock正则化, 标签平滑(Class label smoothing)
  • 主干网络的BoS(Bag of Specials):Mish激活, Cross-stage partial connections (CSPNet), Multiinput weighted residual connections(MiWRC)
  • 检测端的BoF(Bag of Freebies):CIoU-loss, CmBN, DropBlock正则化, Mosaic数据增强, Self-Adversarial Training, 去除边框敏感性(Eliminate grid sensitivity , 见实验部分的解释), 多anchor回归(之前只选最大的), 余弦退火学习率调整(Cosine annealing scheduler), 使用遗传算法最优化超参数, 随机输入大小
  • 检测端的BoS(Bag of Specials):Mish激活, SPP-block, SAM-block, PAN通道融合, DIoU-NMS
Mosaic:YOLOv4来了,大型调优现场,速度和准确率俱佳
本文插图

实验
Influence of different features on Classifier training
Mosaic:YOLOv4来了,大型调优现场,速度和准确率俱佳
本文插图

Mosaic:YOLOv4来了,大型调优现场,速度和准确率俱佳
本文插图

CutMix、Mosaic数据增强和标签平衡(Class label smoothing)比较有效 。
Influence of different features on Detector training
Mosaic:YOLOv4来了,大型调优现场,速度和准确率俱佳
本文插图

表4对比的BoF如下:


推荐阅读