Mosaic:YOLOv4来了,大型调优现场,速度和准确率俱佳( 二 )
Additional improvements 为了让模型能更好地在单卡进行训练 , 做了以下的改进:
- 提出新的数据增强方法Mosaic和Self-Adversarial Training (SAT) 。
- 使用遗传算法选择最优的超参数 。
- 修改目前的方法来让训练和检测更有效 , 包括改进的SAM , 改进的PAN以及 Cross mini-Batch Normalization (CmBN)
本文插图
Mosaic是新的数据增强方法 , 同时融合4张训练图片 , CutMix仅融合2张图片 , 使得目标的检测范围超出其正常的上下文 , 另外BN每次统计4张图片 , 这能显著地减少对大mini-batch的需要 。
Self-Adversarial Training(SAT)也提供新的数据增强手段 , 分为两个前向反向阶段 。 在第一阶段 , 先对图片进行前向计算 , 然后通过反向传播修改图片的像素 , 注意这里不修改网络的权重 , 通过这种方式 , 网络进行了一次对抗式训练 , 制造出没有目标的假象 。 在第二阶段 , 对修改后的图片进行正常的训练 。
本文插图
CmBN是改进版的CBN , 仅统计single-batch中的mini-batch , 如图4所示 , 假设t-3~t为single-batch中的mini-batch , 若干single-batch中包含单个mini-batch , 则CmBN与BN一样 。
本文插图
将SAM从spitial-wise attention修改为point-wise attention , 即输入和输出的大小一致 。
本文插图
将PAN的shortcut连接方法 , 从相加改为concate 。
YOLOv4 YOLOv4包含:
- Backbone:CSPDarknet53
- Neck:SPP , PAN
- Head:YOLOv3
- 主干网络的BoF(Bag of Freebies):CutMix和Mosaic数据增强, DropBlock正则化, 标签平滑(Class label smoothing)
- 主干网络的BoS(Bag of Specials):Mish激活, Cross-stage partial connections (CSPNet), Multiinput weighted residual connections(MiWRC)
- 检测端的BoF(Bag of Freebies):CIoU-loss, CmBN, DropBlock正则化, Mosaic数据增强, Self-Adversarial Training, 去除边框敏感性(Eliminate grid sensitivity , 见实验部分的解释), 多anchor回归(之前只选最大的), 余弦退火学习率调整(Cosine annealing scheduler), 使用遗传算法最优化超参数, 随机输入大小
- 检测端的BoS(Bag of Specials):Mish激活, SPP-block, SAM-block, PAN通道融合, DIoU-NMS
本文插图
实验
Influence of different features on Classifier training
本文插图
本文插图
CutMix、Mosaic数据增强和标签平衡(Class label smoothing)比较有效 。
Influence of different features on Detector training
本文插图
表4对比的BoF如下:
推荐阅读
- 第一财经|AI芯片独角兽来了!寒武纪“闪电”过会,拟募资28亿元
- 装机帝|10th酷睿有门道,618来了10600KF怎么配?有满血Z490还犹豫啥
- 微视观|年度旗舰华为Mate40X来了 芯片拍照功能全面升级
- 搜狐新闻|都说买手机就买华为,昔日王者旗舰迎来大幅降价,机会来了!
- |小米快跟进!华为新专利曝光:屏下摄像头终于要来了
- 山东伟豪思|袋料全自动拆垛机器人的使用给企业带来了哪些益处
- 央视网|倒计时!火星,我们来了!
- 大哥大短讯|苹果时代又来了吗,销量甩华为十八条街
- 太平洋电脑网|被 AirPods Pro 价格劝退?来来来,500 块钱价格段的降噪真无线来了
- 老王撩机|100倍双目变焦,这次能拍月亮了吧,7988元起售的华为P40Pro+来了
