引入

  论文地址:https://cs.nju.edu.cn/zhouzh/zhouzh.files/publication/icdm14.pdf
  论文应用:处理大规模MIL问题。
  论文出发点:将包映射为Fisher vector表示。

1 miFV

  算法名miFV:multi-instance learning based on the Fisher Vector representation

1.1 Fisher Vector (FV)

  FV (Fisher Vector) 1是计算机视觉中,将一组从图像中提取到的patch编码为高维向量,并合并为一个图像级别的signature。

  令S={st,t=1,,T}S = \{ \boldsymbol{s}_t, t = 1, \dots, T \}为具有TT个观测值stS\boldsymbol{s}_t \in \mathcal{S}的样本;
  令pp是一个用λ\lambda建模,并生成S\mathcal{S}中元素的概率密度函数,则
  样本SS可以用一个梯度向量描述:
GλS=λlogp(Sλ).(1) G^S_{\lambda} = \bigtriangledown_{\lambda} \log p (S | \lambda). \tag{1}   需要注意的是GλSG^S_{\lambda}的维度仅仅取决于pp的数量,而与样本大小TT无关,即,将不定长度的集合SS转换为固定长度的GλSG^S_{\lambda}。这一性质将很好地适应于miFV的映射函数Mf\mathcal{M}_f

  Fisher Kernel (FK) 2最初用于度量两个样本S1S_1S2S_2的相似性:
KFK(S1,S2)=GλS1Fλ1GλS2,(2) \mathcal{K}_{FK} (S_1, S_2) = {G^{S_1}_{\lambda}}' F_{\lambda}^{-1} G^{S_2}_{\lambda}, \tag{2} 其中FλF_{\lambda}是Fisher信息矩阵pp (下面公式里用到的是s\mathcal{s},而非SS,不知道是否是表述有错):
Fλ=Esp[λlogp(sλ)[λlogp(sλ)].(3) F_{\lambda} = E_{\mathcal{s} \sim p} [\bigtriangledown_{\lambda} \log p (\mathcal{s} | \lambda) [\bigtriangledown_{\lambda} \log p (\mathcal{s} | \lambda)']. \tag{3}
  由于FλF_{\lambda}是对称且正定的,则其可近似为Fλ1=LλLλF_{\lambda}^{-1} = L_{\lambda}'L_{\lambda},且 式 (2)将被重写为:
KFK(S1,S2)=fλS1fλS2,(4) \mathcal{K}_{FK} (S_1, S_2) = \boldsymbol{f}_{\lambda}^{{S_1}'} \boldsymbol{f}_{\lambda}^{{S_2}}, \tag{4} 其中
fλS=LλGλS=Lλλlogp(Sλ)(5) \boldsymbol{f}_{\lambda}^{{S}} = L_{\lambda} G_{\lambda}^S = L_{\lambda} \bigtriangledown_{\lambda} \log p (S | \lambda) \tag{5}
  式 (5)所示的标准化后的梯度向量便是Fisher Vector (FV)。就结果而言,非线性核与KFK\mathcal{K}_{FK}一起使用将等同于线性核与FV一起使用。

1.2 使用FV重新表示包

  将一个包看作是一个样本SS。在传统的机器学习假设中,包中实例为独立同分布,因此S\mathcal{S}中的st\boldsymbol{s}_t可以独立的由pp生成。这里的pp选择为高斯混合模型 (GMM),并使用最大似然估计 (MLE)进行评估。具体过程如算法1。

  12

算法1:miFV算法

  1. 输入:
  2.   训练集{(X1,y1),,(Xi,yi),,(XNB,yNNB)}\{ (X_1, y_1), \dots, (X_i, y_i), \dots, (X_{N_B}, y_{N_{N_B}}) \}
  3. 训练:
  4.   

伪代码原图如下:
论文阅读 (五):Scalable Multi-Instance Learning (miFV2014)


  1. J. S ´ anchez, F. Perronnin, T. Mensink, and J. Verbeek, “Image Classification with the Fisher Vector: Theory and Practice,”
    Int’l J. Computer Vision, vol. 105, no. 3, pp. 222–245, 2013. ↩︎

  2. T. Jaakkola and D. Haussler, “Exploiting Generative Models in Discriminative Classifiers,” in Advances in Neural Information Processing Systems 11. Cambridge, MA: MIT Press, 1999, pp. 487–493. ↩︎

相关文章: