作者提出,训练集中的类别不平衡是阻碍一阶段检测器达到与二阶段检测器相同效果的主要原因(因为在二阶段检测中,在前景和背景数量上通过启发式采样例如固定前景背景比例,online hard mining部分解决了这一问题),因此提出一个新的loss函数。
相反在一阶段中,尽管启发式采样也被应用,但是训练过程仍然被易被分类的背景examples所主导。这一问题可以通过bootstrapping或者hard example mining解决。
对于bootstrapping介绍见https://blog.csdn.net/chenhongc/article/details/9404583
hard negative mining见https://blog.csdn.net/u012285175/article/details/77866878
而focal loss的思想即,在训练中通过scaling factor自动降低易训练的样本对训练的贡献,而提升难训练样本的权重。至于loss公式具体的形式并不是最重要的,以下给出了一种形式:

在的前提下(高IOU的样本被权重弱化)调整几个值显示不同IOU下单独的loss结果。
作者同时给出网络结构RetinaNet(基于ResNet-101-FPN主干)来显示focal loss的效果。

Focal Loss针对训练集中类别不平衡的问题,通过调整因子自动降低易分类样本的权重,提高难分类样本的影响力,从而改进一阶段检测器的效果。在ResNet-101-FPN主干网络的RetinaNet中,Focal Loss展现出优秀的表现,其在交叉熵基础上增加调节因子,减少易分类样本的贡献,专注于训练难例。实验表明,Focal Loss对于处理大量易分类背景样本具有显著优势,提高了检测器的性能。

9556

被折叠的 条评论
为什么被折叠?



