原论文:《T.-Y. Lin, P. Goyal, R. Girshick, K. He, and P. Doll´ar. Focal loss for dense object detection[C]. In ICCV, 2017.》
- 特意设计了专门的目标检测网络 RetinaNet 进行实验验证。
- 论文中经过实验得到 RetinaNet 中损失函数超参数的 一对最佳值:γ=2、α=0.25。
目的:解决目标检测模型中存在的正负样本不平衡问题。
方法:通过损失函数,抑制分类正确的样本在权重更新中的作用。样本被正确分类的得分越高,其作用越低。
比如:一个得分为0.99的正样本比得分0.70的正样本作用小;一个得分为0.01的负样本比一个得分为0.40的负样本作用小。
1. Focal Loss 损失函数
首先介绍 交叉熵损失函数(Cross Entropy)以及 平衡交叉熵损失函数(Balanced Cross Entropy),这两个函数对提出 Focal Loss 损失函数 有启发作用。
记 y 为正负类别,1 为正 0 为负;p 是模型对正类别的预测值,1−p 是对负类别的预测值。
-
交叉熵损失函数
CE(p,y)={−log(p) if y=1−log(1−p) if y=0
记
pt={p if y=11−p if y=0
则
CE(p,y)=CE(pt)=−log(pt)
-
平衡交叉熵损失函数
CE(pt)=−αtlog(pt)
其中,α∈[0,1],且
αt={α if y=11−α if y=0
1.1 Focal Loss 损失函数
FL(pt)=−(1−pt)γlog(pt)
γ≥0 是超参数,被称为可调焦点参数(Tunable Focusing Parameter),下面是不同值控制下的损失函数曲线。论文的实验中,γ=2 的效果最好。

1.2 基于 α 的 Focal Loss 损失函数
这个是实际使用的损失函数。
FL(pt)=−αt(1−pt)γlog(pt)
2. RetinaNet 网络
结构图:

不再详细介绍该网络。
最后是实验数据:

