:23个系列分类网络,10万分类预训练模型,这是飞桨PaddleClas百宝箱( 三 )
文章图片
文章图片
图 5 蒸馏模型提升效果图
高阶优化支持之 8 种数据增广方法
在图像分类任务中 , 图像数据的增广是一种常用的正则化方法 , 可以有效提升图像分类的效果 , 尤其对于数据量不足或者模型网络较大的场景 。常用的数据增广可以分为 3 类 , 图像变换类、图像裁剪类和图像混叠类:
图像变换类是指对全图进行一些变换 , 包括 AutoAugment、RandAugment 。
图像裁剪类是指对图像以一定的方式遮挡部分区域的变换 , 包括 CutOut、RandErasing、HideAndSeek、GridMask 。
图像混叠类是指多张图进行混叠一张新图的变换 , 包括 Mixup、Cutmix 。
文章图片
文章图片
图 6 数据增广方法
PaddleClas 提供了上述 8 种数据增广算法的复现 , 以及在统一实验环境下的效果评估 , 如图 7 所示 。该图展示了不同数据增广方式在 ResNet50 上的表现, 与标准变换相比 , 采用数据增广的识别准确率最高可以提升 1% 。不要小看这 1% , 如果应用到实际业务中 , 这可能就是多识别出几千几万张图片呢!
文章图片
文章图片
图 7 数据增广算法对比图
工业级部署工具
飞桨提供了一系列实用工具 , 便于工业应用部署 PaddleClas , 包括 TensorRT 部署推理、移动端部署推理、模型服务化部署等等 。而这些工具大都以图像分类为例 , 提供示例教程和进行优化 。因此如果用户使用 PaddleClas 训练的模型 , 通过参考文档教程中的实用工具章节 , 就可以很方便的把模型集成到自己的服务中 , 完成相应的图像分类任务 。
实际应用案例
10 万类图像分类预训练模型
在实际应用中 , 由于训练数据匮乏 , 往往将 ImageNet1K 数据集训练的分类模型作为预训练模型 , 然后进行图像分类的迁移学习 。然而 ImageNet1K 数据集的类别只有 1000 种 , 预训练模型的特征迁移能力有限 。因此百度自研了一个有语义体系的、粒度有粗有细的 10W 级别的 Tag 体系 。通过使用人工或半监督方式 , 至今收集到 5500w+ 图片训练数据;该系统是国内甚至世界范围内最大规模的图片分类体系和训练集合 。
百度的小伙伴基于 PaddleClas 提供的 ResNet_vd 系列网络结构的训练方法和预训练模型 , 训练了一批大规模图像分类预训练模型 , 并应用到实际图像分类相关业务中 。下表显示了一些实际应用场景中 , 基于 ResNet50_vd , 使用 ImageNet 预训练模型和 10 万类图像分类预训练模型的效果比对 , 使用 10 万类图像分类预训练模型 , 识别准确率最高可以提升 30% 。最最重要的是 , 上述预训练模型都已经在 PaddleClas 上开源了!心动的小伙伴们不要错过啊!
文章图片
文章图片
PSS-DET 实用目标检测算法
近年来 , 学术界和工业界广泛关注图像中目标检测任务 , 而图像分类的网络结构以及预训练模型效果直接影响目标检测的效果 。PaddleDetection 使用 PaddleClas 的 ResNet50_vd_ssld 预训练模型作为骨干网 , 结合丰富的检测算子 , 提供了一种面向服务器端应用的目标检测方案 , PSS-DET (Practical Server Side Detection) 。
推荐阅读
- AutoR智驾|电力不够持久?以色列推出动态无线充电网络 充电效率90%
- AutoR智驾|电力不够持久?以色列推出动态无线充电网络,一夜铺设一公里、充电效率90%
- 宅秘|华为路由Q2S开启首销 有效解决大中户型网络覆盖难题
- 合伙|上海依图网络科技有限公司注册资本新增2.18% 投资人新增红杉、高瓴投资实体
- PS索尼宣布PS5游戏网络发布会延期 新日期尚未确定
- 盒子|618网络机顶盒怎么选?萌新必看的五大热销旗舰
- 美好,一直在身边|科普中国回应:美国并不能通过根服务器让中国网络“瘫痪”
- |中兴AXON 11 SE发布:首款支持四大运营商网络5G手机
- 代餐|没团队,没技术,没资源,适合大多数人的网络赚钱之路
- 青烟故人离|全面5G网络的覆盖时间表公布,网友直呼:被坑办理了5G流量套餐
