RetinaNet论文

1、引入

摘要：本文是2017年何凯明 ICCV最佳学生论文奖。论文认为单阶段目标检测低于两阶段的原因是正负样本不均衡，为了降低影响，提出focal loss损失函以及检测网络结构，提升了性能。
优点：无论是精度还是速度都是全面超越。
创新点：

提出focal loss损失函苏。
提出目标检测网络结构。
可以用于多标签分类（损失函数使用的是binary_cross_entropy_with_logits）。

2、网络结构

如图2-1所示。

使用多尺度特征金字塔网络。
分类与回归使用两个子网络，网络结构相同但不共享参数。

RetinaNet论文
图2-1 网络结构

3、损失函数

改编交叉熵损失函数。
$FL(p_t)=-\alpha _t(1-p_t)^\gamma log(p_t)$

$\alpha_t$ 是系数，有利于提高精度。
损失函数使用的是binary_cross_entropy_with_logits，用于多标签分类。

4、参数设置

损失函数： $\alpha\in [0.25,0.27],$ 本文设置 $\alpha =0.25,\gamma=2$ 。
anchor scales $\times$ aspects=6/9
重要
因此正负样本不平衡，为了使模型训练前期保持稳定。将除了分类子网络最后一层，其余层w设为u=0, $\sigma =0.01$ 的高斯分布，b=0。最后一层为了使每一个anchor为前景的概率都为 $\pi$ 。因此w设为u=0, $\sigma =0.01$ 的高斯分布，b设为 $-log((1-\pi)/\pi)$ 。b的推导：输出概率使用逻辑回归函数即 $\cfrac 1 {1+e^{-x}}$ 。本文中将 $\pi$ 设为0.01，思想是增加正样本的损失值。

相关文章：

猜你喜欢

相关资源

相似解决方案

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode