小镇的夕阳何恺明Focal Loss改进版!GFocal Loss:良心技术,无cost涨点( 二 )
这就很有可能引发这么一个情况:一个分类score相对低的真正的负样本 , 由于预测了一个不可信的极高的质量score , 而导致它可能排到一个真正的正样本(分类score不够高且质量score相对低)的前面 。
问题一如图所示:
本文插图
不一致啊不一致, End-to-end 表示很难受
问题二:bbox regression 采用的表示不够灵活 , 没有办法建模复杂场景下的uncertainty 。
问题二比较好理解 , 在复杂场景中 , 边界框的表示具有很强的不确定性 , 而现有的框回归本质都是建模了非常单一的狄拉克分布 , 非常不flexible 。
我们希望用一种general的分布去建模边界框的表示 。 问题二如图所示(比如被水模糊掉的滑板 , 以及严重遮挡的大象):
本文插图
模糊及界定不清晰的边界
那么有了这些问题 , 我们自然可以提出一些方案来一定程度上解决他们:
1、对于第一个问题 , 为了保证training和test一致 , 同时还能够兼顾分类score和质量预测score都能够训练到所有的正负样本 , 那么一个方案呼之欲出:就是将两者的表示进行联合 。 这个合并也非常有意思 , 从物理上来讲 , 我们依然还是保留分类的向量 , 但是对应类别位置的置信度的物理含义不再是分类的score , 而是改为质量预测的score 。 这样就做到了两者的联合表示 , 同时 , 暂时不考虑优化的问题 , 我们就有可能完美地解决掉第一个问题 。
2、对于第二个问题 , 我们选择直接回归一个任意分布来建模框的表示 。 当然 , 在连续域上回归是不可能的 , 所以可以用离散化的方式 , 通过softmax来实现即可 。 这里面涉及到如何从狄拉克分布的积分形式推导到一般分布的积分形式来表示框 , 详情可以参考原论文 。
Ok , 方案都出来了还算比较靠谱 , 但是问题又来了:
怎么优化他们呢?
这个时候就要派上Generalized Focal Loss出马了!
我们知道之前Focal Loss是为one-stage的检测器的分类分支服务的 , 它支持0或者1这样的离散类别label 。
然而 , 对于我们的分类-质量联合表示 , label却变成了0~1之间的连续值 。 我们既要保证Focal Loss此前的平衡正负、难易样本的特性 , 又需要让其支持连续数值的监督 , 自然而然就引出了我们对Focal Loss在连续label上的拓展形式之一 , 我们称为Quality Focal Loss (QFL) , 具体地 , 它将原来的Focal Loss从:
本文插图
魔改为:
本文插图
其中y为0~1的质量标签 ,
本文插图
为预测;注意QFL的全局最小解即是 = y 。
这样交叉熵部分变为完整的交叉熵 , 同时调节因子变为距离绝对值的幂次函数 。
和Focal Loss类似 , 我们实验中发现一般取
本文插图
= 2为最优 。
对于任意分布来建模框的表示 , 它可以用积分形式嵌入到任意已有的和框回归相关的损失函数上 , 例如最近比较流行的GIoU Loss 。
这个实际上也就够了 , 不过涨点不是很明显 , 我们又仔细分析了一下 , 发现如果分布过于任意 , 网络学习的效率可能会不高 , 原因是一个积分目标可能对应了无穷多种分布模式 。
推荐阅读
- 电竞嘤嘤怪|主播进军短视频成为风潮?PDD携夕阳红入驻快手,梦泪也跟上了
- 趣头条|大狗与养马岛的美融为一体,让人恋恋不舍。,夕阳西下
- 文史旺旺|小镇青年:被放大的幸福、孤独和欲望
- 两大赛事在温州泰顺“中国石雕小镇”举行,当地要把温润似玉的泰顺石打造成中国“国石”
- 上海崇明|上青旅助力绿华特色小镇产业发展
- 新华网|美国伊利诺伊州举办小镇南瓜节
- 斗玩网|继PDD夕阳红入驻后,快手又迎一哥天团!网友:签约费十亿都不够
- 太阳系|最远50亿公里!在太阳系其它星球上看夕阳,真实照片不是PS的
- 纵相新闻|贫困小镇产出全国七成演出服装,这个靠缝纫发家的地方,了不起!?
- 小镇的夕阳权威技术机构研究报告颠覆全球观念:加油站燃爆与使用手机无关
