:23个系列分类网络,10万分类预训练模型,这是飞桨PaddleClas百宝箱( 三 )


:23个系列分类网络,10万分类预训练模型,这是飞桨PaddleClas百宝箱
文章图片

文章图片

图 5 蒸馏模型提升效果图
高阶优化支持之 8 种数据增广方法
在图像分类任务中 , 图像数据的增广是一种常用的正则化方法 , 可以有效提升图像分类的效果 , 尤其对于数据量不足或者模型网络较大的场景 。常用的数据增广可以分为 3 类 , 图像变换类、图像裁剪类和图像混叠类:
图像变换类是指对全图进行一些变换 , 包括 AutoAugment、RandAugment 。
图像裁剪类是指对图像以一定的方式遮挡部分区域的变换 , 包括 CutOut、RandErasing、HideAndSeek、GridMask 。
图像混叠类是指多张图进行混叠一张新图的变换 , 包括 Mixup、Cutmix 。
:23个系列分类网络,10万分类预训练模型,这是飞桨PaddleClas百宝箱
文章图片

文章图片

图 6 数据增广方法
PaddleClas 提供了上述 8 种数据增广算法的复现 , 以及在统一实验环境下的效果评估 , 如图 7 所示 。该图展示了不同数据增广方式在 ResNet50 上的表现, 与标准变换相比 , 采用数据增广的识别准确率最高可以提升 1% 。不要小看这 1% , 如果应用到实际业务中 , 这可能就是多识别出几千几万张图片呢!
:23个系列分类网络,10万分类预训练模型,这是飞桨PaddleClas百宝箱
文章图片

文章图片

图 7 数据增广算法对比图
工业级部署工具
飞桨提供了一系列实用工具 , 便于工业应用部署 PaddleClas , 包括 TensorRT 部署推理、移动端部署推理、模型服务化部署等等 。而这些工具大都以图像分类为例 , 提供示例教程和进行优化 。因此如果用户使用 PaddleClas 训练的模型 , 通过参考文档教程中的实用工具章节 , 就可以很方便的把模型集成到自己的服务中 , 完成相应的图像分类任务 。
实际应用案例
10 万类图像分类预训练模型
在实际应用中 , 由于训练数据匮乏 , 往往将 ImageNet1K 数据集训练的分类模型作为预训练模型 , 然后进行图像分类的迁移学习 。然而 ImageNet1K 数据集的类别只有 1000 种 , 预训练模型的特征迁移能力有限 。因此百度自研了一个有语义体系的、粒度有粗有细的 10W 级别的 Tag 体系 。通过使用人工或半监督方式 , 至今收集到 5500w+ 图片训练数据;该系统是国内甚至世界范围内最大规模的图片分类体系和训练集合 。
百度的小伙伴基于 PaddleClas 提供的 ResNet_vd 系列网络结构的训练方法和预训练模型 , 训练了一批大规模图像分类预训练模型 , 并应用到实际图像分类相关业务中 。下表显示了一些实际应用场景中 , 基于 ResNet50_vd , 使用 ImageNet 预训练模型和 10 万类图像分类预训练模型的效果比对 , 使用 10 万类图像分类预训练模型 , 识别准确率最高可以提升 30% 。最最重要的是 , 上述预训练模型都已经在 PaddleClas 上开源了!心动的小伙伴们不要错过啊!
:23个系列分类网络,10万分类预训练模型,这是飞桨PaddleClas百宝箱
文章图片

文章图片

PSS-DET 实用目标检测算法
近年来 , 学术界和工业界广泛关注图像中目标检测任务 , 而图像分类的网络结构以及预训练模型效果直接影响目标检测的效果 。PaddleDetection 使用 PaddleClas 的 ResNet50_vd_ssld 预训练模型作为骨干网 , 结合丰富的检测算子 , 提供了一种面向服务器端应用的目标检测方案 , PSS-DET (Practical Server Side Detection) 。


推荐阅读