Hard-Aware Point-to-Set Deep Metric for Person Re-identification 论文笔记

一、提出问题

度量学习是行人重识别任务中的重要组成部分之一，但是度量损失的性能受采样方法的显着影响，传统的采样方法极大地限制了深度度量学习的性能。

二、论文贡献

提出了一种新的度量损失，即困难感知点集（HAP2S）损失，该损失涉及自适应硬挖掘机制；
在Market-1501，CUHK03和DukeMTMC-reID 三个数据集上进行测试，HAP2S损失达到了SOTA。

三、模型结构

Hard-Aware Point-to-Set Deep Metric for Person Re-identification 论文笔记

图3-1 模型结构

3.1 概况

深度度量度学习的目的是学习一个将图像x映射到对应的特征表示 Hard-Aware Point-to-Set Deep Metric for Person Re-identification 论文笔记的深度神经网络，其适合于预定义的度量，在Θ中包含网络的参数权重和偏差。对于行人重识别，可以通过训练好的深度提取探测器提取probe和gallery图像的特征，然后计算两者特征之间的距离并获得距离排序列表。在其中度量损失的作用是为监督网络训练提供判别度量。

模型结构如图3-1所示，采用预训练的CNN模型作为骨干网络，将每个行人图像转换为特征嵌入，本文选用的骨干网络是ResNet-50模型，它由五个下采样块和一个全局平均池化层组成。骨干网络之后是两个全连接层，分别具有1024和128个神经元。在骨干网和两个FC层之后，利用网络提取的输出特征计算小批量中的HAP2S损失，用欧式距离作为点对点（P2P）的度量。

3.2 回顾Triplet Loss

设一个三元组 Hard-Aware Point-to-Set Deep Metric for Person Re-identification 论文笔记，是锚点，是正样本，是负样本，三者的特征可表示为，则Triplet Loss可表示为：

Hard-Aware Point-to-Set Deep Metric for Person Re-identification 论文笔记

在训练具有Triplet Loss的CNN时，多数候选三元组很容易满足约束条件：

Hard-Aware Point-to-Set Deep Metric for Person Re-identification 论文笔记

这就使得这些选定的三元组对训练没有贡献，因此，困难样本的挖掘对Triplet Loss至关重要。赫尔曼斯等人提出了一种Triplet Loss的变体，它采用简单而强大的硬挖掘方案，定义为：

Hard-Aware Point-to-Set Deep Metric for Person Re-identification 论文笔记

选择小批量中每个锚点的最难正样本和最难的负样来构成三元组。

3.3 硬感知的P2S loss

Triplet Loss是一种P2P的loss
这种简单的硬挖掘策略带来两个问题

排除了其他困难样本在梯度下降训练中的贡献;
容易受到最难样本异常值的影响，最难的样本若出现异常则会导致错误的反向传播

以上两个问题说明简单的硬挖掘策略的健壮性存在问题

本文提出P2S(point-to-set) loss，设锚点的标签为 Hard-Aware Point-to-Set Deep Metric for Person Re-identification 论文笔记，是mini batch内的正样本集，相应的，是负样本集，P2S loss定义为：

Hard-Aware Point-to-Set Deep Metric for Person Re-identification 论文笔记

其中D代表P2S距离，P2S Triplet Loss是一种更普通的形式，如果P2S距离定义为以下形式，则可以将P2S Triplet Loss转换成方程（3）中的P2P Triplet Loss。

Hard-Aware Point-to-Set Deep Metric for Person Re-identification 论文笔记

换句话说，从P2S loss的角度来看，方程（3）中的Triplet Loss是P2S loss的一种特殊形式，只选择最难的样本来表示整个集合。

本文提出的HAP2S loss与方程（4）具有相同的形式，HAP2S loss的关键是通过计算P2S距离为每组中的点分配不同的权重，HAP2S距离定义为：

Hard-Aware Point-to-Set Deep Metric for Person Re-identification 论文笔记

其中 Hard-Aware Point-to-Set Deep Metric for Person Re-identification 论文笔记和分别表示正样本集合和负样本集合中的元素和的权重。有效的硬挖掘策略应该为一组中的更困难的样本分配更高的权重，考虑到度量损失，样本的“难度级别”应该根据该店到锚点的距离。因此，对于正样本集，锚点的远点是困难点，应赋予更高的权重，而对于负样本集，最靠近锚点的点是最困难的。基于此，为HAP2S损失引入了两种加权方案。