王哈哈哈|伪标签(Pseudo-Labelling)——锋利的匕首( 二 )


EntropyRegularization
“EntropyRegularization(Grandvaletetal.,2006)isameanstobenefitfromunlabeleddataintheframeworkofmaximumaposterioriestimation.Thisschemefavorslowdensityseparationbetweenclasseswithoutanymodelingofthedensitybyminimizingtheconditionalentropyofclassprobabilitiesforunlabeleddata.”
作者考虑的两个点:
王哈哈哈|伪标签(Pseudo-Labelling)——锋利的匕首
文章图片
图5熵正则化方法
在理论外 , 伪标签技术给人的第一感觉就是利用置信度高的样本来提升模型的拟合能力 。 在聚类假设及熵正则化的角度上 , 这是符合我们的感受的 , 这也使得使用这项技术变得自然而然 。
值得注意的是:当场景不满足聚类假设、熵正则化失效(样本空间覆盖密集)情况下 , 伪标签技术很有可能失效 。 在用之前判断适用条件 , 对症下药 , 才能将伪标签这把匕首的作用发挥出来 。
【王哈哈哈|伪标签(Pseudo-Labelling)——锋利的匕首】本文目的在于学术交流 , 并不代表本公众号赞同其观点或对其内容真实性负责 , 版权归原作者所有 , 如有侵权请告知删除 。
王哈哈哈|伪标签(Pseudo-Labelling)——锋利的匕首
文章图片


推荐阅读