引入

  论文地址:https://www.ijcai.org/Proceedings/2017/262
  目标:设计一种针对MIML的查询策略,以便获取更为准确的信息而无需附加代价。
  步骤:
  1)设计一种选择最大价值bag-label对的标准;
  2)Oracle反馈包与标签的相关性。

1 算法基础

  本文部分符号表如下:

符号 意义
DlD_l 初始有标记集
NlN_l 有标记集大小
DuD_u 无标记集
(Xi,Yi)(X_i, Y_i) MIML对象
Xi={xi1,,xi,mi}X_i = \{ \mathbf{x}_{i1}, \cdots, \mathbf{x}_{i, m_i} \} ii个包
xijRd\mathbf{x}_{ij} \in \mathbb{R}^d 包中实例
mim_i 包大小
Yi=[yi1,,yi,K]TY_i = [y_{i1}, \cdots, y_{i, K}]^{\rm T} 包标签
U(X)U (X) 包未查询标签集

  说明:XDuX \in D_u iff U(X)>0\mid U (X) \mid > 0

1.1 已有标准

  说明:该部分略看即可。
  受多标签主动学习 1启发,使用diversity和uncertainty来选择bag-label对:

g(Xi)=k=1KI[y^ik>0]1Nlj=1Nlk=1KI[yjk>0]max{ξ,Kcard(U(Xi))},(1) g\left(X_{i}\right)=\frac{\left|\sum_{k=1}^{K} I\left[\hat{y}_{i k}>0\right]-\frac{1}{N_{l}} \sum_{j=1}^{N_{l}} \sum_{k=1}^{K} I\left[y_{j k}>0\right]\right|}{\max \left\{\xi, K-\operatorname{card}\left(U\left(X_{i}\right)\right)\right\}}, \tag{1} 其中y^ik\hat{y}_{ik}是包XiX_i的第kk个标签的预测;ξ(0,1)\xi \in (0, 1)是一个用于避免除00的常量;card\rm card用于计算集合大小;I[x]={1,x=True;0,oterwise.I [x] = \begin{cases}1, x = {\rm True};\\0, {\rm oterwise.}\end{cases}这里的分母表示当前包有多少个标签已经被查询。最终,将选择具有最大ggXX^*

  以下公式用于评测标签yy对于包XX^*的信息量,即yy的预测离决策边界的远近:

h(X,y)=fy(X)fy0(X),(2) h (X^*, y) = \mid f_y (X^*) - f_{y_0} (X^*) \mid, \tag{2} 其中fyf_y是一个预测函数;y0y_0是一个用于划分相关标签与不相关标签的虚拟标签。通常假设离决策边界越近不确定性越大,因此将选择具有最小hhyy^*
  Oracle将决定所选择bag-label对,即(X,y)(X^*, y^*)的相关性。如果没有相关性,则yy^*是一个负标签;反之,Oracle将说明该包中哪一个实例决定标签yy^*,该实例也称为关键实例,用x\mathbf{x}^*表示。

1.2 新标准

  通过最小化标签定义上的rank loss,MIML可以转换为label ranking问题 2。受其启发,关于x\mathbf{x}的第kk个表情的预测函数定义如下:

fk(x)=wkTW0x,(3) f_k (\mathbf{x}) = \mathbf{w}_k^{\rm T} W_0 \mathbf{x}, \tag{3} 其中W0Rb×dW_0 \in \mathbb{R}^{b \times d}表示将原始dd维特征向量映射到稀疏空间的矩阵。

  看不下去了。。。。

2 算法流程

论文阅读 (十):Multi-Instance Multi-Label Active Learning (2017MIML-AL)


  1. [Huang and Zhou, 2013] S.-J. Huang and Z.-H. Zhou. Active query driven by uncertainty and diversity for incremental multi-label learning. In Proceedings of the 13th IEEE International Conference on Data Mining, pages 1079–1084, 2013. ↩︎

  2. [Huang et al., 2014a] S.-J. Huang, W. Gao, and Z.-H. Zhou. Fast multi-instance multi-label learning. In Proceedings of the 28th AAAI Conference on Artificial Intelligence, pages 1868–1874, 2014. ↩︎

相关文章: