「Mosaic」YOLOv4来了,大型调优现场,速度和准确率俱佳
本文插图
本文插图
作者 | VincentLee来源 | 晓飞的算法工程笔记
本文插图
简介
本文插图
论文提出YOLOv4 , 从图1的结果来看 , 相对于YOLOv3在准确率上提升了近10个点 , 然而速度并几乎没有下降 , 论文主要贡献如下:
- 提出速度更快、精度更好的检测模型 , 仅需要单张1080Ti或2080Ti即可完成训练 。
- 验证了目前SOTA的Bag-ofFreebies(不增加推理成本的trick)和Bag-of-Specials(增加推理成本的trick)的有效性 。
- 修改了SOTA方法 , 让其更高效且更合适地在单卡进行训练 , 包括CBN、PAN、SAM等 。
本文插图
方法论 Selection of architecture 对检测模型来说 , 分类最优的主干网络不一定是最合适的 , 适用于目标检测的主干网络需满足以下要求:
- 高输入分辨率 , 提高小物体的检测准确率 。
- 更多的层 , 提高感受域来适应输入的增加 。
- 更多的参数 , 提高检测单图多尺寸目标的能力 。
本文插图
理论来讲 , 应该选择感受域更大且参数了更大的模型作为主干网络 , 表1对比了三种SOTA主干网络的 , 可以看到CSPDarknet53的感受域、参数量以及速度都是最好的 , 故选其为主干网络 。
本文插图
另外 , 使用不同大小的感受域有以下好处:
- 匹配物体大小 , 可以观察完整的物体 。
- 匹配网络大小 , 可以观察物体的上下文信息 。
- 超过网络的大小 , 增加点与最终激活之间的连接数 。
本文插图
另外 , 使用PANet替换FPN来进行多通道特征的融合 。
最终 , YOLOv4选择CSPDarknet53作为主干网络 , 配合SPP模块 , PANet通道融合以及YOLOv3的anchor based head 。
Selection of BoF and BoS 目前比较有效的目标检测提升的trick:
- 激活函数: ReLU, leaky-ReLU, parametric-ReLU, ReLU6, SELU, Swish, or Mish 。
- bbox回归损失: MSE, IoU, GIoU, CIoU, DIoU
- 数据增强: CutOut, MixUp, CutMix
- 正则化方法: DropOut, DropPath, Spatial DropOut, or DropBlock
- 归一化方法: Batch Normalization(BN), Cross-GPU Batch Normalization(CGBN or SyncBN), Filter Response Normalization (FRN), or Cross-Iteration Batch Normalization(CBN)
推荐阅读
- ▲退伍军人拿军残证购票,遭乘务员辱骂:活不起就别活,官方通告来了
- 『深圳市』最新!吉林省疫情通报来了
- 【广州恒大】来新人了!恒大中卫位置迎来了黑马强援助阵,曾在西班牙留洋多年
- 金台资讯你会听吗?(网上中国),长音频来了
- 双世宠妃第三部■《双世宠妃3》又双叒来了!原班人马开拍!邢昭林还在陈宥维缺席
- 华为:华为最强神秘新旗舰来了! 首发鸿蒙OS系统+屏下摄像头: 售价或破万
- #荣耀#荣耀X10来了:升降全面屏+麒麟820,或是最值得买的5G手机!
- 拿破仑科穆宁安「游戏时局图」《大菠萝2重制》还是来了?资深爆料记者再出新闻
- 平日笑谈绝对不能坑队友,就算医生来了也不行!,幽默笑话:小伙子
- 虎扑足球莱曼谈老特拉福德大战:弗格森和温格都快打起来了
