『图片』增强版CutMix：CMU提出Attentive CutMix |语义|CutMix|Mix

北京联盟_本文原题：增强版CutMix：CMU提出Attentive CutMix
论文标题：Attentive CutMix: An Enhanced Data Augmentation Approach for Deep Learning Based Image Classification
论文链接：https://arxiv.org/abs/2003.13048
本文提出了一种新的 Data Augmentation 的方法：Attentive CutMix 。基于 CutMix 的随机空间混合的数据增强方法，本文提出在选取混合区域的时候考虑区域的语义信息含量，提取语义信息量最大的区域覆盖到新的图片上进行混合，将更有利于网络学习有效特征。
Attentive CutMix 可以看作是增强版 CutMix, 在 ImageNet 等数据集以及 ResNet 等网络上均取得了相较于 CutMix 和 MixUp 更优的结果。
研究动机
近来有许多基于图片融合的数据增强方法如 MixUp [1] ， CutMix [2] 等等，通过简单的将两张图片进行像素值上或者是空间上的线性混合，在图像分类问题中取得了有效的性能提升。
而且研究者发现局部替换相比全局融合在语义层面更加明确，效果也更好，比如 CutMix 。但是由于 CutMix 都是随机混合，而没有考虑语义上的重要性差异。
最近， CMU 实验室的研究者们发现，如果借助训练好的网络根据图片本身特有的特征进行有选择性地剪切混合，可以更好地促进图片进行融合，突出最具有分辨性的图片区域，从而帮助网络训练和学习，几种相关方法的对比如下图所示：

本文插图

Mixup 是对于两张不同图片上的像素值进行混合，并且修改相应的标签， CutOut 是随机去除遮盖图片的一部分， CutMix 是随机将图片的一部分区域替换为另一张训练图片的内容，并修改相应的标签。
方法
本文中提出的 Attentive CutMix 则是将新图片中语义信息最显著的多个区域切割下来，覆盖到原图中，从而更有利于网络学习正确的特征来分辨不同的图片。
Attentive CutMix 的具体实现方式如图所示：

本文插图

先将待融合的图片通过一个用于特征提取的已训练好的神经网络，得到 7x7 的热度图。然后根据热度图的值，找到热度值最高的 N 个网格，从输入图片中将这些网格对应的区域裁剪下来，覆盖到另一张带融合图片上，用于训练目标神经网络。
同时， ground truth label 也根据融合的图片的类和剪切的区域的大小比例而相应修改。
该方法有个缺点就是需要用一个训练好的网络先过一遍图片产生 attention map ，这样会产生额外的计算开销，不过作者指出这个特征提取网络不需要太大，额外引入的计算量相比于分类网络本身而言是可以接受的。
实验
作者在 Cifar10 ，Cifar100 和 ImageNet 数据集和 ResNet ， DenseNet ， EfficientNet 等网络结构上都进行了实验， Attentive CutMix 均取得了比 MixUp 和 CutMix 更好的效果：
Cifar10 上的实验结果：

本文插图

Cifar100 上的实验结果：

本文插图

ImageNet 上的实验结果：

本文插图

参考文献
[1] Hongyi Zhang, Moustapha Cisse, Yann N. Dauphin, and David Lopez-Paz. "mixup: Beyond empirical risk minimization." In ICLR 2018.

『图片』增强版CutMix：CMU提出Attentive CutMix

推荐阅读

【猫眼娱乐V】安娜·温图尔儿子确诊新冠，曾陪英国女王看秀，被授予王室勋章，原创

NBA官网|湖人将获1200万美元收入，打剩下8场常规赛

zol中关村在线海信护眼平板Q5评测：护眼不是这平板的所有特色

81平米现代风装修，二居室的房子越看越有品

车轱辘|优享价5.39万起，凯翼炫界正式上市。，林允代言

可口可乐|再来一瓶无法就近兑奖：魔爪饮料被罚20万

「易度时尚」炫酷和粉嫩，谁是火箭少女腿精？，杨超越吴宣仪同穿“肥宅T恤”

乐居财经：代价约1.51亿港元，泛海酒店购入面值2180万美元恒大票据

黑乎乎还是黑呼呼

小种红茶的几岁老人喝,小种茶的泡法

【新冠肺炎】截至12日北京新冠肺炎线上医生咨询平台访问量234万余人次

大腕儿娱乐1 中国却研究发展的最好，日本网友怒斥：明明是我们最先研究

滇红茶古树晒红,普绿古树红茶

辽宁男篮|11战轰334分！30万临时工打出巨星数据，辽蜜：加薪，下季续约他

关于恋爱，是不是应该忽冷忽热忽近忽远

【影之书数码】最有性价比的8+128GB千元机，还支持NFC，从1799降至1329

『向阳愿景TB』你只知道广州的早茶，却不懂它的宵夜

本·拉登|拉登的妻子和情人众多，揭秘他身边的女人们(组图)

中国网科技|老股东亲述：易果生鲜如何从宠儿走到破产重整？

让“微光”燎原