Few-shot Learning with Graph Neural Networks

Paper : FEW-SHOT LEARNING WITH GRAPH NEURAL NETWORKS
Code : official

摘要

作者使用GNN建模少样本学习任务中的消息传递过程，将每个样本看作是图中的节点，少样本学习转化为图中给出部分节点的标签以后进行训练的点分类任务。作者提出的GNN建模方法还可以扩展到半监督学习或主动学习的任务上。

问题设定

首先给出少样本学习，主动学习和半监督学习的通用描述，考虑输入输出对 $(\mathcal T,\mathcal Y)$
$\mathcal T = \{\{(x_1,l_1),...,(x_s,l_s)\},\{\widetilde x_1,...,\widetilde x_r\},\{\overline x_1,...,\overline x_t\}\} \\\text{subject to } l_i \in \{1,...,K\} \\\mathcal Y = (y_1,...,y_t) \\\text{subject to } y_i \in \{1,...,K\}$
其中符号含义如下

$s$ 表示有标签的样本个数
$t$ 表示无标签的样本个数
$t$ 测试集大小
$K$ 样本的种类数

在本篇文章中，我们固定 $t=1$ ，即每次只使用一个测试样本

考虑标准的监督学习的训练目标为

$\min_\theta \frac{1}{L} \sum_{i=1}^L \mathcal L(f_\theta(\mathcal T_i),\mathcal Y_i) + \text{Reg}(\theta)$

少样本学习： $r=0,s=qK$ ，被称为 q-shot K-way learning
半监督学习： $r>0$
主动学习： $r>0$ ，学习器可以询问 $\widetilde x_i$ 的标签

方法

少样本学习的任务就是把标签信息从标签样本上传递到未标记的询问图片上，这种信息传递的方法可以通过GNN进行建模。我们根据任务 $\mathcal T$ 建立全连接网络 $G_\mathcal T =(V,E)$ ，将任务 $\mathcal T$ 中出现的所有样本作为节点，边的权重使用类似孪生神经网络的可学习的参数模型进行计算。

本文中使用MLP与绝对值来衡量点与点之间的距离

$\widetilde A_{i,j}^{(k)} = \varphi_{\widetilde \theta}(x_i^{(k)},x_j^{(k)}) = \text{MLP}_{\widetilde \theta}(\text{abs}(x_i^{(k)}-x_j^{(k)}))$

训练过程如下所示

Few-shot Learning with Graph Neural Networks

通过对在每一行上进行softmax将可训练的邻接矩阵归一化为随机核。通过将邻接矩阵 $\widetilde A$ 添加到邻接矩阵族 $\mathcal A = \{\widetilde A^{(k)},\text 1_{|\mathcal T|\times |\mathcal T|}\}$ 中并应用