MOT论文笔记《Towards Real-Time Multi-Object Tracking》

论文地址：https://arxiv.org/pdf/1909.12605v1.pdf

代码地址：https://github.com/Zhongdao/Towards-Realtime-MOT

Abstract

当前的多目标跟踪（MOT）系统通常遵循 “tracking-by-detection”的方式，主要包括两个部分（1）检测模型----用于目标定位（2）表观嵌入模型（appearance embedding）----用于数据关联。分别执行两个模型可能会导致效率问题，因为运行时间只是两个步骤的总和，而没有研究可以在它们之间共享的潜在结构。

现有的关于实时MOT的研究工作通常集中在关联步骤上，因此它们本质上是实时关联方法，但不是实时MOT系统。在本文中，我们提出了一种MOT系统，该系统允许在共享模型中学习目标检测和外观嵌入。具体来说，我们将外观嵌入模型合并到单个检测器中，以便该模型可以同时输出检测结果和相应的嵌入。这样，该系统被表述为一个多任务学习问题：存在多个目标，即锚点分类，边界框回归和嵌入学习；并自动对单个损失进行加权。据我们所知，这项工作报告了第一个（近）实时MOT系统，其运行速度取决于输入分辨率，可以达到18.8至24.1 FPS。同时，其跟踪准确性可与采用独立检测和嵌入（SDE）学习的最新跟踪器相媲美(64.4% MOTA v.s. 66.1% MOTA on MOT-16 challenge).