前言

样本合成是解决小样本学习问题的方法之一,所谓样本合成,就是在给定少量训练样本的情况下,在特征空间中利用这些训练样本合成新的样本,然后利用这些合成样本提升小样本学习任务的泛化能力。但是目前的合成方法仅处理的是每个图像中仅有一个类别标签(比如C(Img)=dogC(Img)=dog)这样的情况,而多标签的情况还从未被提及过(比如C(Img)={dog,leash,person,forest}C(Img)=\lbrace dog,leash,person,forest \rbrace

本文针对小样本学习问题提出了一种新的解决方法,主要用于处理多标签样本的情况,并且通过任务定义,还可以处理事先并不清楚标签是什么的情况。 如下图所示,假设想要为野生动物构建一个多标签分类器,于是到动物园中拍了几张照片,但所有的动物都在笼子里(图a),而我们想得到的是用于处理野外动物的分类器(图c):
LaSO: Label-Set Operations networks for multi-label few-shot learning 论文笔记
为了解决这个问题,可以在特征空间中通过样本对语义内容进行操作,比如对于一个特征向量,可以隐藏其中对应于另一个特征向量的标签相对应的元素。这里用模型MintM_{int}接收两张被关在笼子里的动物的图像(图b),并且生成一个特征向量,用于表示这两张图像的共有语义内容。由于它们共有的内容是“笼子”,因此应该得到表示“笼子”的特征向量,而不应该出现原始相交图像中的笼中动物。接下来考虑另一个模型MsubM_{sub},它可以从另一个样本中移除某样本存在的内容。将MsubM_{sub}应用到笼中老虎图(图a)和表示“笼子”的特征向量上,那么就可以得到表示“野外的老虎”(图c)的特征向量。也就是上图中的,图a减去图b的交集,就得到一只野外的老虎。

通过以上例子,我们可以得到一个基于样本的语义内容操作模型,MintM_{int}表示对标签集进行“交”操作,MuniM_{uni}表示“并”操作,MsubM_{sub}表示“差”操作,将这些模型称为标签集操作网络(Label Set Operation network,LaSO),将成对儿的图像作为输入,首先通过backbone转换为特征向量,然后通过LaSO进行处理,得到相应的标签集的特征向量。如下图所示,使用LaSO在特征空间中对两张图像的特征向量进行操作,得到新的合成的特征向量,进而得到多标签样本。
LaSO: Label-Set Operations networks for multi-label few-shot learning 论文笔记
本文的贡献如下:

  • 提出小样本多标签学习任务(few-shot multi-label learning task),是小样本学习的一个新方向;
  • 提出“在特征空间中通过样本对标签集进行操作”这一概念,通过结合训练样本得到新的多标签样本;
  • 为小样本多标签学习提出一种新的benchmark。

方法实现

LaSO: Label-Set Operations networks for multi-label few-shot learning 论文笔记
如上图所示,输入图像分别为XXYY,每个图像都有一个多标签集L(X),L(Y)LL(X),L(Y)\subseteq L,在特征空间FF中分别被表示为FX,FYF_X,F_Y,这个FF是由backbone特征提取网络BB得到的。三个LaSO网络Mint,Muni,MsubM_{int},M_{uni},M_{sub}FXF_XFYF_Y的结合作为输入,然后在FF中得到合成的特征向量。MintM_{int}可表示为:
LaSO: Label-Set Operations networks for multi-label few-shot learning 论文笔记
ZintZ_{int}对应一个假设的图像II,如图所示,II中出现的是FXF_XFYF_Y的交集:人和狗。同样的,MuniM_{uni}MsubM_{sub}的输出分别为Zuni,ZsubFZ_{uni},Z_{sub} \in F。注意到,LaSO并没有接收确切的标签信息作为输入,FXF_XFYF_Y中是标签集,输入到LaSO网络后,得到的是相应操作的合成向量,该合成向量中也没有指明确切的标签信息。因此,LaSO甚至可以泛化到不属于LL的标签。

Zint,ZuniZ_{int},Z_{uni}ZsubZ_{sub}被送入分类器CC中,使用二值交叉熵(BCE) 多标签分类损失来训练CC和LaSO网络:
LaSO: Label-Set Operations networks for multi-label few-shot learning 论文笔记
ss是分类分数,ll是得到的标签集向量,ii是类别索引。使用FXF_XFYF_Y的损失的结合来训练分类器CC
LaSO: Label-Set Operations networks for multi-label few-shot learning 论文笔记
LaSO网络的损失为:
LaSO: Label-Set Operations networks for multi-label few-shot learning 论文笔记
此外,模型还包含一系列基于均方误差(MSE) 的重构损失,如图中的右下角所示,

  • 第一个损失RlosssymR^{sym}_{loss}用于增强相交和并集操作的对称性,它由ZintZ_{int}ZuniZ_{uni}之间的MSE实现:
    LaSO: Label-Set Operations networks for multi-label few-shot learning 论文笔记

  • 第二个损失RlossmcR_{loss}^{mc}用于降低模型发生崩溃的可能性,模型崩溃可能导致每种可能的标签集组合出现半固定的输出。比如,如果许多不同的图像对儿具有相同的共享标签,那么MintM_{int}可能会有非常相似的输出。RlossmcR_{loss}^{mc}FXF_XFYF_Y的MSE实现:
    LaSO: Label-Set Operations networks for multi-label few-shot learning 论文笔记


结论

本文提出了一种新的小样本学习任务——多标签小样本分类,并提出用LaSO来解决这个问题。

相关文章:

  • 2021-05-22
  • 2022-12-23
  • 2021-06-16
  • 2021-06-28
  • 2021-07-04
  • 2021-05-19
  • 2021-11-22
  • 2021-11-29
猜你喜欢
  • 2021-09-06
  • 2021-11-22
  • 2021-11-26
  • 2021-09-19
  • 2021-10-08
  • 2022-01-16
  • 2021-12-14
相关资源
相似解决方案