Mosaic：YOLOv4来了，大型调优现场，速度和准确率俱佳( 二 ) |算法|网页设计|S

Additional improvements 为了让模型能更好地在单卡进行训练，做了以下的改进：

提出新的数据增强方法Mosaic和Self-Adversarial Training (SAT) 。
使用遗传算法选择最优的超参数。
修改目前的方法来让训练和检测更有效，包括改进的SAM ，改进的PAN以及 Cross mini-Batch Normalization (CmBN)

本文插图

Mosaic是新的数据增强方法，同时融合4张训练图片， CutMix仅融合2张图片，使得目标的检测范围超出其正常的上下文，另外BN每次统计4张图片，这能显著地减少对大mini-batch的需要。
Self-Adversarial Training(SAT)也提供新的数据增强手段，分为两个前向反向阶段。在第一阶段，先对图片进行前向计算，然后通过反向传播修改图片的像素，注意这里不修改网络的权重，通过这种方式，网络进行了一次对抗式训练，制造出没有目标的假象。在第二阶段，对修改后的图片进行正常的训练。

本文插图

CmBN是改进版的CBN ，仅统计single-batch中的mini-batch ，如图4所示，假设t-3~t为single-batch中的mini-batch ，若干single-batch中包含单个mini-batch ，则CmBN与BN一样。

本文插图

将SAM从spitial-wise attention修改为point-wise attention ，即输入和输出的大小一致。

本文插图

将PAN的shortcut连接方法，从相加改为concate 。
YOLOv4 YOLOv4包含：

Backbone：CSPDarknet53
Neck：SPP ， PAN
Head：YOLOv3

YOLO v4使用：

主干网络的BoF(Bag of Freebies)：CutMix和Mosaic数据增强, DropBlock正则化, 标签平滑(Class label smoothing)
主干网络的BoS(Bag of Specials)：Mish激活, Cross-stage partial connections (CSPNet), Multiinput weighted residual connections(MiWRC)
检测端的BoF(Bag of Freebies)：CIoU-loss, CmBN, DropBlock正则化, Mosaic数据增强, Self-Adversarial Training, 去除边框敏感性(Eliminate grid sensitivity ，见实验部分的解释), 多anchor回归(之前只选最大的), 余弦退火学习率调整(Cosine annealing scheduler), 使用遗传算法最优化超参数, 随机输入大小
检测端的BoS(Bag of Specials)：Mish激活, SPP-block, SAM-block, PAN通道融合, DIoU-NMS