http://www.iqiyi.com/w_19s6ts6pyd.html#vfrm=8-8-0-1 学习记录

弱监督学习的标注方式

1. 用划线或者是点标注目标,比如下图

弱监督学习

2. 标注图像级标签(如上图中,“人”作为标签)

重点讲讲后者

后者的关键是,将key word和图像中的pixel结合起来,用到了语义分割的工具:

(1) salient-instance detection, 将显著性物体检测出来,比如上图,将人脸部分检测出来,与key-word关联

(2)从分类网络中,得到特征图,得到attention map(通过看特征图,判断主要通过哪一部分的图片进行的分类)。attention map是最有区别性的区域。它的优点是定位准,但是缺点是不全面,比如只看人脸就可以判断是人,然而,在弱监督学习中,我们希望将label“人”对应的区域都分割出。目前有一种方法,是通过不断迭代,每次将已经分出的区分区域擦除,最后将每次迭代的结果综合起来的方法,希望找到key word对应的全面区域。不过这个方法也是有局限,一是可能某些地方比如衣摆等等很难被作为明显的区分区域,而是对迭代次数的要求高,如果迭代次数少,找不全,如果过多,则可能因为将区分区域都擦除了,导致将和key word不相关区域都收入进来

 

相关文章: