这是CVPR2018 Oral的一片关于Weakly-Supervised Video Grounding的文章,paper连接http://ai.stanford.edu/~dahuang/papers/cvpr18-ramil.pdf,作者的homepage http://ai.stanford.edu/~dahuang/,code暂时没有被released出来。
文章要做的事情:
输入:sentence+video         输出:bounding box(train的时候没有bbox ground truth)
文章中show出来的example如下所示。
Finding “It”: Weakly-Supervised Reference-Aware Visual Grounding in Instructional Videos
文章在两个datasets上面的实验结果如下所示。
Finding “It”: Weakly-Supervised Reference-Aware Visual Grounding in Instructional Videos

相关文章:

  • 2021-06-20
  • 2021-09-16
  • 2021-07-04
  • 2021-10-12
  • 2021-11-16
  • 2021-07-08
  • 2021-12-14
  • 2021-06-19
猜你喜欢
  • 2022-03-09
  • 2021-12-02
  • 2022-01-08
  • 2021-05-04
  • 2021-06-01
  • 2022-01-05
  • 2021-12-31
相关资源
相似解决方案