论文地址:https://arxiv.org/pdf/1909.12605v1.pdf
代码地址:https://github.com/Zhongdao/Towards-Realtime-MOT
Abstract
当前的多目标跟踪(MOT)系统通常遵循 “tracking-by-detection”的方式,主要包括两个部分(1)检测模型----用于目标定位(2)表观嵌入模型(appearance embedding)----用于数据关联。分别执行两个模型可能会导致效率问题,因为运行时间只是两个步骤的总和,而没有研究可以在它们之间共享的潜在结构。
现有的关于实时MOT的研究工作通常集中在关联步骤上,因此它们本质上是实时关联方法,但不是实时MOT系统。在本文中,我们提出了一种MOT系统,该系统允许在共享模型中学习目标检测和外观嵌入。具体来说,我们将外观嵌入模型合并到单个检测器中,以便该模型可以同时输出检测结果和相应的嵌入。这样,该系统被表述为一个多任务学习问题:存在多个目标,即锚点分类,边界框回归和嵌入学习; 并自动对单个损失进行加权。据我们所知,这项工作报告了第一个(近)实时MOT系统,其运行速度取决于输入分辨率,可以达到18.8至24.1 FPS。同时,其跟踪准确性可与采用独立检测和嵌入(SDE)学习的最新跟踪器相媲美(64.4% MOTA v.s. 66.1% MOTA on MOT-16 challenge).