Mosaic:YOLOv4来了,大型调优现场,速度和准确率俱佳
本文插图
本文插图
作者 | VincentLee来源 | 晓飞的算法工程笔记
本文插图
简介
本文插图
论文提出YOLOv4 , 从图1的结果来看 , 相对于YOLOv3在准确率上提升了近10个点 , 然而速度并几乎没有下降 , 论文主要贡献如下:
- 提出速度更快、精度更好的检测模型 , 仅需要单张1080Ti或2080Ti即可完成训练 。
- 验证了目前SOTA的Bag-ofFreebies(不增加推理成本的trick)和Bag-of-Specials(增加推理成本的trick)的有效性 。
- 修改了SOTA方法 , 让其更高效且更合适地在单卡进行训练 , 包括CBN、PAN、SAM等 。
本文插图
方法论 Selection of architecture 对检测模型来说 , 分类最优的主干网络不一定是最合适的 , 适用于目标检测的主干网络需满足以下要求:
- 高输入分辨率 , 提高小物体的检测准确率 。
- 更多的层 , 提高感受域来适应输入的增加 。
- 更多的参数 , 提高检测单图多尺寸目标的能力 。
本文插图
理论来讲 , 应该选择感受域更大且参数了更大的模型作为主干网络 , 表1对比了三种SOTA主干网络的 , 可以看到CSPDarknet53的感受域、参数量以及速度都是最好的 , 故选其为主干网络 。
本文插图
另外 , 使用不同大小的感受域有以下好处:
- 匹配物体大小 , 可以观察完整的物体 。
- 匹配网络大小 , 可以观察物体的上下文信息 。
- 超过网络的大小 , 增加点与最终激活之间的连接数 。
本文插图
另外 , 使用PANet替换FPN来进行多通道特征的融合 。
最终 , YOLOv4选择CSPDarknet53作为主干网络 , 配合SPP模块 , PANet通道融合以及YOLOv3的anchor based head 。
Selection of BoF and BoS 目前比较有效的目标检测提升的trick:
- 激活函数: ReLU, leaky-ReLU, parametric-ReLU, ReLU6, SELU, Swish, or Mish 。
- bbox回归损失: MSE, IoU, GIoU, CIoU, DIoU
- 数据增强: CutOut, MixUp, CutMix
- 正则化方法: DropOut, DropPath, Spatial DropOut, or DropBlock
- 归一化方法: Batch Normalization(BN), Cross-GPU Batch Normalization(CGBN or SyncBN), Filter Response Normalization (FRN), or Cross-Iteration Batch Normalization(CBN)
推荐阅读
- 第一财经|AI芯片独角兽来了!寒武纪“闪电”过会,拟募资28亿元
- 装机帝|10th酷睿有门道,618来了10600KF怎么配?有满血Z490还犹豫啥
- 微视观|年度旗舰华为Mate40X来了 芯片拍照功能全面升级
- 搜狐新闻|都说买手机就买华为,昔日王者旗舰迎来大幅降价,机会来了!
- |小米快跟进!华为新专利曝光:屏下摄像头终于要来了
- 山东伟豪思|袋料全自动拆垛机器人的使用给企业带来了哪些益处
- 央视网|倒计时!火星,我们来了!
- 大哥大短讯|苹果时代又来了吗,销量甩华为十八条街
- 太平洋电脑网|被 AirPods Pro 价格劝退?来来来,500 块钱价格段的降噪真无线来了
- 老王撩机|100倍双目变焦,这次能拍月亮了吧,7988元起售的华为P40Pro+来了
