论文 阅读:Adaptive Subspaces for Few-Shot Learning
论文
代码
这是一篇2020cvpr的一篇关于少数样本学习的论文,它主要是跟2017年的Prototypical Networks的模型相关。
introduction
这篇论文主要是使用一种动态的子空间分类器,为每个类别计算出一个特征空间的子空间,然后将查询样本的特征向量投射到子空间中,在子空间中进行距离度量,并预测类别。
Method
子空间分类器的模型主要使输入图像,然后通过嵌入模块提取图像的特征,首先是使用的高阶信息,而不是低阶信息,将模型提取的特征与每个类别的特征向量的平均值做差,然后使用奇异值分解(SVD)得到投影矩阵Pc,然后将查询图像q投影到Pc上,基于从查询到它在Pc上的最短距离进行分类。
1. 计算每个类别c对应的特征向量:
2. 每个类别可以得到:
3. 对Xc进行奇异值分解得到Pc
4.计算查询向量到每个类别之间的距离:
5.通过softmax计算查询样本到哦每个类别之间的概率:
损失函数:
损失函数第一项为分类损失,第二项为正则化项,主要是通过最大化各个子空间之间的距离来实现的,各个子空间之间的距离主要是使用Grassmannian投影矩阵实现的。
Semi-Supervised Learning
首先重新定义了每个类别的均值求解函数,通过下面的公式,
其中
mi 是对于没有标签的the soft-assignment score。为了处理干扰的存在,本文使用均值为零的伪类。