使用半监督学习从研究到产品化的3个教训( 五 )
如果类平衡对SSL在实践中的成功至关重要 , 那么我们如何在半监督的物体检测中实现类平衡呢?未来解决这一问题的研究肯定会受到欢迎 。
其他的一些Tips迁移学习和自训练叠加
正如在Zoph et al., 2020中对COCO训练发现的那样 , 从COCO到我们的数据集执行转移学习 , 然后在Noisy Student中进行自训练 , 取得的结果比单独执行两个步骤中的任何一个都要好 。 应用于生产模型的任何迁移知识很可能也可以应用于SSL模型 , 带来同等或更多的好处 。
适当的数据增强很重要
由于数据增强是现代SSL方法的主要组成部分 , 所以要确保这些增强对你的领域有意义 。 例如 , 如果可用的扩展集包括水平翻转 , 那么训练用于区分左箭头和右箭头的边框的分类器显然会受到影响 。
此外 , 在STAC和Noisy Student中 , 他们观察到 , 在自训练中 , 对教师模型使用数据增强会导致较差的下游学生模型 。
文章插图
表6来自Xie et al., 2019 。 在这项消融研究中 , 他们表明 , 有增强的教师模型比没有增强的教师模型表现略差(在130M未标记图像上 , 分别为84.4%和85.1%) 。
然而 , 我们发现 , 在我们的数据集上 , 使用数据增强的教师模型的Noisy Student和STAC的性能与不使用增强的教师模型相当或略好 。 虽然我们的结果可能是我们自己的数据集的一个特例 , 但我们相信这显示了广泛实验的重要性 , 并对你在论文中读到的观点的所谓成功和失败保持好奇 。 论文中显示的实证结果是一个很好的开始 , 但成功肯定是不能保证的 , 在SSL中仍有许多从理论角度尚不清楚的理解 。
临别赠言在过去的一年里 , 半监督学习(SSL)是我们工作的一个令人兴奋的领域 , 它在我们的生产模型中的最终结果向我们(也希望你们所有人)表明 , 在某些情况下可以而且应该考虑SSL 。
特别是在Noisy Student中进行自训练 , 对于改进我们的目标检测模型是有效的 。 以下是我们在研究和生产深层SSL技术时所学到的3个主要教训:
- 简单为王
- 使用启发式的伪标签优化是非常有效的
- 半监督图像分类的进展很难转化为目标检测
英文原文:@nairvarun18/from-research-to-production-with-deep-semi-supervised-learning-7caaedc39093
更多内容 , 请关注微信公众号“AI公园” 。
推荐阅读
- Biogen将使用Apple Watch研究老年痴呆症的早期症状
- Eyeware Beam使用iPhone追踪玩家在游戏中的眼睛运动
- 计算机专业大一下学期,该选择学习Java还是Python
- 假期弯道超车 国美学习“神器”助孩子变身“学霸”
- 想自学Python来开发爬虫,需要按照哪几个阶段制定学习计划
- 未来想进入AI领域,该学习Python还是Java大数据开发
- 或使用天玑1000+芯片?荣耀V40已全渠道开启预约
- 苹果将推出使用mini LED屏的iPad Pro
- 手机能用多久?如果出现这3种征兆,说明“默认使用时间”已到
- Google AI建立了一个能够分析烘焙食谱的机器学习模型
