多目标跟踪论文 Deep SORT 评测指标

flyfish

参考地址
https://arxiv.org/pdf/1603.00831.pdf

主要是解释说明论文中这个图是什么意思。
多目标跟踪论文 Deep SORT 评测指标
因为名词解释有包含关系,所有没有按照论文给出的顺序解释
MT和ML的解释
ground truth trajectory 分为
mostly tracked (MT),
partially tracked (PT),
mostly lost(ML).

每个目标被跟踪的过程都有一个生命周期(life span),如果是一个人,相当于这个人走进摄像头可视的范围,然后慢慢的走出了摄像头的可视范围。
如果在这一跟踪过程中,80%的life span中的这个目标都是被跟踪的叫 mostly tracked (MT)
如果少于20%的life span中这个目标是被跟踪的叫mostly lost(ML).
其余全部都是partially tracked (PT)
因为是1-MT-ML=PT,所以论文只给MT,ML就够了
MT是越大越好,ML是越小越好。
这三个指标是跟踪算法能够覆盖多少轨迹的指标

ID的解释
ID这里是IDSW
IDSW就是ID Switch,也就是同一个目标但是Track ID变化了,
ID数值越小越好。
后面在说FM的时候,会再解释一次IDSW

FM的解释
就是Fragmentation 理解就是一个不完整的片段
例如有一个目标在1到2帧都是被跟踪的,假设Track ID是123,在第三帧中找不到这个目标了,这时候我们就说发生了中断 ,FM数就要加1。如果在后面帧又跟踪到了这个目标,Track ID变化为124,我们就说发生了ID Switch。
FM数加1还是不加1与Track ID是否发生变化无关。只与目标跟踪有没有中断有关。
FM数值是越小越好

FP和FN
看这里
FP ( False Positive)是误报
FN (False Negative)可以理解为missed target的数量,有目标但没跟踪目标的数量
还可以理解成ground truth没匹配上

MOTA
Multiple Object Tracking Accuracy
这个参数是论文里最重要的参数
MOTA=1t(FNt+FPt+IDSWt)tGTt \mathrm{MOTA}=1-\frac{\sum_{t}\left(\mathrm{FN}_{t}+\mathrm{FP}_{t}+\operatorname{IDSW}_{t}\right)}{\sum_{t} \mathrm{GT}_{t}}

式子中的t表示 帧索引( frame index)
GT(ground truth也可以理解为annotation)是标注目标的个数

简单理解就是 1减去(所有的错除以总数)。这个总数包括正确的和错误的。
MOTA越接近于1表示性能越好,1相当于没有任何错误。
MOTA是重要的指标,看其他目标跟踪的论文里几乎都会有的指标。

MOTP
Multiple Object Tracking Precision
MOTP=t,idt,itct \mathrm{MOTP}=\frac{\sum_{t, i} d_{t, i}}{\sum_{t} c_{t}}

where ctc_t denotes the number of matches in frame tt and dt,id_{t, i} is the bounding box overlap of target$ i$ with its assigned ground truth object.

Rumtime

Hz是Tracker speed in frames per second

相关文章: