1.动机
现在大多数改进方案都是从网络框架和backbone出发
IoU
1.黑框-bbox;绿框-groundtruth
2.用右下角和左上角来表示bbox,即(x1,x2,y1,y2)
3.相同的n-范数(如l2-norm)距离,不同的IoU阈值
4.相同的IoU阈值,不同的w\h比例,具有不同的客观价值
5.随着参数增加(比如旋转),复杂度也增加→引入anchor
→在优化回归损耗和IoU值之间仍然存在差距
- IoU同时作为指标(metric)和损失(loss),问题:如果两个物体不交叠,那么IoU为零,而不会反映两个形状之间的距离。这种情况下,如果IoU用作一个损失(loss),那么它的梯度就是零而不会被优化。
2.贡献点
GIoU
(a)遵循与IoU相同的定义,即将比较对象的形状属性编码为region属性;
(b)保持IoU的尺度不变性;
(c)确保在对象重叠的情况下与IoU有很强的关联性。
(d)提供了一种用于计算两个轴对齐的矩形之间的GIoU的解析解决方案
3.方案
3.1 IoU
• IoU作为距离,例如L(IoU)= 1-IoU,是一个衡量标准。 它表示所有指标的所有属性,例如非负性,不可识别的身份,对称性和三角不等式。
• 两个任意形状A和B之间的相似性独立于其空间S的大小
• 如果| A∩B | = 0,则IoU(A,B)= 0。 在这种情况下,如果两个形状彼此相邻或彼此距离很远,IoU不会反映出来。
3.2 GIoU
- 类似于IoU的L(IoU)= 1-IoU,L(GIoU)= 1-GIoU。
- GIoU不会影响问题的规模
- GIoU始终是IoU的下限,任意A,B属于 S, GIoU(A,B)≤IoU(A,B),而当A和B的形状一样时GIoU=IoU
- 1≤ GIoU(A,B)≤-1. 且:
- .
3.3 计算方式
1)先找到最小的形状C,包围A\B
2)为了比较两种特定的几何形状类型,C可以来自同一类型。
3)计算C占用的体积(面积)(不包括A和B)之间的比率,然后除以C占用的总体积(面积)。
3.4 As a loss
不重叠的情况下,IoU的梯度均为零,这会影响训练质量和收敛速度,相反,GIoU在所有可能的情况下(包括非重叠情况)都有一个梯度。