本文ICCV workshop Large-Scale Video Object Segmentation Challenge中VIS第二名,王强组做的

Method

第一阶段都是先生成proposal,作者没有用MaskRCNN,用的HTC

第二阶段track,选择SiamMask并做一些改变。

An Empirical Study of Detection-Based Video Instance Segmentation

如图,把两个SiamMask级联。

Stage1里的Box branch生成一个initial proposal of object‘s location,然后在Stage2生成一个mask。这个tracking mask用于找到和当前object有联系的proposal。具体的,会计算tracking mask和每个新的detection mask的IOU, 超过0.7认为是一个class,低于0.4认为不是一个。

第三阶段是Re-classification of object tracks,作者做了实验就是,如果直接把track中的所有detections的类别概率做平均,val效果会不好,会出现misclassified的情况,作者选择了一个后处理的方法来预测最终的class。用HRNet输入cropped images patches of the object along the track,来或者一个新的关于这个object分类概率的track。

 

缺点:后处理分类

 

相关文章:

  • 2021-05-24
  • 2021-07-13
  • 2021-11-27
  • 2021-09-11
  • 2022-01-15
  • 2021-12-27
  • 2022-12-23
  • 2023-01-11
猜你喜欢
  • 2021-09-16
  • 2021-07-18
  • 2021-11-02
  • 2021-11-29
  • 2021-08-19
  • 2021-09-16
  • 2021-04-16
相关资源
相似解决方案