Multi-instance multi-label learning with application to scene classification.

传统的监督学习

对象由实例(或特征向量)表示并与类标签关联。 χ\chi:实例空间(或特征空间),γ\gamma:类标签的集合。 从给定的数据集{(x1,y1),(x2,y2),...,(xm,ym)}\left \{ ({x_1,y_1}),({x_2,y_2}),...,({x_m,y_m}) \right \}中学习一个函数:f:χγf:\chi \rightarrow \gamma,其中x1χx_1\in \chi是一个实例,y1γy_1\in \gammax1x_1的已知标记。

多实例多标签学习(MIML)

一个训练示例由多个实例描述,并与多个类标签关联。χ\chi:实例空间,γ\gamma:类标签的集合。 从给定的数据集{(X1,Y1),(X2,Y2),...,(Xm,Ym)}\left \{ ({X_1,Y_1}),({X_2,Y_2}),...,({X_m,Y_m}) \right \}中学习一个函数fMIML:2χ2γf_{MIML}:2^\chi→2^\gamma,其中XiχX_i\subseteq \chi是一个集合实例{x1(i),x2(i),...,xni(i)},xj(i)χ(j=1,2,...,ni)\left \{x _{1}^{(i)},x _{2}^{(i)},...,x _{n_{i}}^{(i)} \right \},x_{j}^{(i)}\in \chi (j=1,2,...,n_{i})YiγY_i\subseteq \gamma是一组标签{y1(i),y2(i),...,yli(i)},yk(i)γ(k=1,2,...,li)\left \{y _{1}^{(i)},y _{2}^{(i)},...,y _{l_{i}}^{(i)} \right \},y_{k}^{(i)}\in \gamma(k=1,2,...,l_{i})。这里用nin_i表示实例数χi\chi_i,用lil_i表示标签数YiY_i

多实例学习

研究了由多个实例描述的真实对象与一个类标签相关联的问题。任务从给定的数据集{(X1,y1),(X2,y2),...,(Xm,ym)}\left \{ ({X_1,y_1}),({X_2,y_2}),...,({X_m,y_m}) \right \}中学习函数fMIL:2χ{1,+1}f_{MIL}:2^\chi \rightarrow \left \{ -1,+1 \right \},其中XiχX _i\subseteq \chi是一组实例{x1(i),x2(i),...,xni(i)},xj(i)χ(j=1,2,...,ni)\left \{x _{1}^{(i)},x _{2}^{(i)},...,x _{n_{i}}^{(i)} \right \},x_{j}^{(i)}\in \chi (j=1,2,...,n_{i})yi{1,+1}y_i \in\left \{ -1,+1 \right \}XiX_i的标签。

多标签学习

研究了一个实例描述的现实世界对象与多个类标签相关联的问题。任务从给定的数据集{(x1,Y1),(x2,Y2),...,(xm,Ym)}\left \{ ({x_1,Y_1}),({x_2,Y_2}),...,({x_m,Y_m}) \right \}中学习函数fMLL:χ2γf_{MLL}:\chi \rightarrow 2^\gamma,其中χiχ\chi _i\subseteq \chi是一个实例,YiγY_i\subseteq \gamma是一组标签{y1(i),y2(i),...,yli(i)},yk(i)γ(k=1,2,...,li)\left \{y _{1}^{(i)},y _{2}^{(i)},...,y _{l_{i}}^{(i)} \right \},y_{k}^{(i)}\in \gamma (k=1,2,...,l_{i})

  • 多实例学习研究输入空间(或实例空间)中的歧义,其中对象具有许多替代输入描述,即实例;
  • 多标签学习研究输出空间(或标签空间)中的歧义,其中对象具有许多替代输出描述,即标签;
  • MIML同时考虑输入和输出空间中的歧义;
    【Multi-instance multi-label learning】论文笔记
    使用多实例学习或多标签学习作为桥梁,通过在传统的监督学习框架中确定MIML的等效性。
  • 方案一:使用多实例学习作为桥梁
    • 将MIML学习任务(即学习功能fMIML:2χ2γf_{MIML}:2^\chi→2^\gamma)转换为多实例学习(即学习功能fMIL:2χ×γ{1,+1}f_{MIL}:2^\chi ×\gamma\rightarrow \left \{ -1,+1 \right \})。对于任何yγy\in\gamma,如果yYiy\in Y_i,则fMIL(Xi,y)=+1f_{MIL}(X_i,y)=+1,否则为-1。可以根据Y={yargyγ[fMIL(X,y)=+1]}Y^*=\left \{ y|arg_{y\in\gamma} [f_{MIL}(X^*,y)=+1 ]\right \}确定新示例XX^*的适当标签。
    • 将此多实例学习任务进一步转换为传统的有监督学习任务,即在指定如何从fSISL(xj(i),y)(j=1,...ni)f_{SISL}\left ( x_{j}^{(i)},y \right )\left ( j=1,...n_i \right )导出fMIL(Xi,y)f_{MIL}\left ( X_i,y \right )的约束下学习函数fSISL:χ×γ{1,+1}f_{SISL}:\chi \times \gamma\rightarrow \left \{ -1,+1 \right \}。对于任何yγy\in\gammafSISL(xj(i),y)=+1f_{SISL}\left ( x_{j}^{(i)},y \right )=+1,否则为-1。这里的约束条件可以是fMIL(Xi,y)=sign[j=1nifSISL(xj(i),y)]f_{MIL}\left ( X_i,y \right )= sign\left [ \sum _{j=1}^{n_i}f_{SISL}\left ( x_j^{(i)} ,y\right )\right ],此条件已用于将多实例学习任务转换为传统的有监督学习任务。这里也可以用其他类型的约束。
  • 方案二:使用多标签学习作为桥梁
    • 将MIML学习任务(即学习功能fMIML:2χ2γf_{MIML}:2^\chi→2^\gamma)转换为多标签学习任务(即学习功能fMLL:Z2γf_{MLL}:Z\rightarrow 2^{\gamma})。对于任何ziZz_{i}\in Z,如果zi=ϕ(Xi),ϕ:2χZz_{i}= \phi \left ( X_{i} \right ),\phi :2^{\chi }\rightarrow Z,则fMLL(zi)=fMIML(Xi)f_{MLL}\left ( z_{i} \right )=f_{MIML}\left ( X_{i} \right )。可以根据Y=fMLL(ϕ(X))Y^{*}= f_{MLL}\left ( \phi \left ( X^{*} \right ) \right )确定新示例XX^*的适当标签。
    • 可以将多标签学习任务进一步转换为传统的有监督学习任务,即学习函数fSISL:Z×γ{1,+1}f_{SISL}:Z\times \gamma \rightarrow \left \{ -1,+1 \right \}。对于任何yγy\in\gamma,如果yYiy\in Y_i,则fSISL(zi,y)=+1f_{SISL}\left ( z_{i},y \right )=+1,否则为-1。也就是说fMLL(zi)={yargyγ[fSISL(zi,y)=+1]}f_{MLL}\left ( z_{i} \right )= \left \{ y|arg_{y\in\gamma}[f_{SISL}\left ( z_{i},y \right )=+1] \right \}
    • 这里的映射可以通过构造聚类来实现,该聚类已用于将多实例包转换为传统的单实例。这里也可以用其他类型的映射。
  • 算法:MIML BOOST(对应方案一)
    • 给定任何集合Ω\Omega,让Ω|\Omega|表示其大小,即Ω\Omega中的元素数;给定任何谓词π\pi,如果π\pi成立,则[[π]][[\pi]]为1,否则为0;给定(Xi,Yi)\left ( X_{i},Y_{i} \right),对于任何yYy\in Y,如果yYiy\in Y_i,则令Ψ(Xi,y)=+1\Psi \left ( X_{i},y \right )=+1,否则为-1,其中Ψ\Psi是函数Ψ:2χ×γ{1,+1}\Psi :2^{\chi }\times \gamma \rightarrow \left \{ -1,+1 \right \}。表1为MIML BOOST算法。
    • 第一步,将每个MIML示例(Xu,Yu)(u=1,2,...,m)\left ( X_{u},Y_{u} \right )\left ( u=1,2,...,m \right )转换为多实例袋的数量γ\left | \gamma \right |集合,即{[(Xu,y1),Ψ(Xu,y1)],[(Xu,y2),Ψ(Xu,y2)],...,[(Xu,yγ),Ψ(Xu,yγ)]}\left \{ \left [ \left ( X_{u},y_{1} \right ),\Psi \left ( X_{u},y_{1} \right ) \right ] , \left[ \left ( X_{u},y_{2} \right ),\Psi \left ( X_{u},y_{2} \right ) \right ] ,...,\left[ \left ( X_{u},y_{\left | \gamma \right |} \right ),\Psi \left ( X_{u},y_{\left | \gamma \right |} \right ) \right ]\right \}。注意,[(Xu,yv),Ψ(Xu,yv)](v=1,2,...,γ)\left [ \left ( X_{u},y_{v} \right ),\Psi \left ( X_{u},y_{v} \right ) \right ]\left ( v=1,2,...,\left | \gamma \right | \right )是标记的多实例袋,其中(Xu,yv)\left ( X_{u},y_{v} \right )是包含实例数量为nun_u的袋,即{(x1(u),yv),(x2(u),yv),...,(xnu(u),yv)}\left \{ \left ( x_{1}^{\left ( u \right )},y_{v} \right ) ,\left ( x_{2}^{\left ( u \right )},y_{v} \right ),...,\left ( x_{n_u}^{\left ( u \right )},y_{v} \right )\right \}Ψ(Xu,yv){+1,1}\Psi \left ( X_{u},y_{v} \right )\in \left \{ +1,-1 \right \}是这个袋子的标签。
    • 因此,原始MIML数据集将转换为一个多实例数据集,包含袋数m×γm\times \left | \gamma \right |,即{[(X1,y1),Ψ(X1,y1)],...,[(X1,yγ),Ψ(X1,yγ)],[(X2,y1),Ψ(X2,y1)],...,[(Xm,yγ),Ψ(Xm,yγ)]}\left \{ \left [ \left ( X_1,y_1 \right ),\Psi \left ( X_1,y_1 \right ) \right ],...,\left [ \left ( X_1,y_{|\gamma|} \right ),\Psi \left ( X_1,y_{|\gamma|} \right ) \right ], \left [ \left ( X_2,y_1 \right ),\Psi \left ( X_2,y_1 \right ) \right ],...,\left [ \left ( X_m,y_{|\gamma|} \right ),\Psi \left ( X_m,y_{|\gamma|} \right ) \right ] \right \}。令[(X(i),y(i)),Ψ(X(i),y(i))]\left [ \left ( X^{\left ( i \right )} ,y^{\left ( i \right )} \right ),\Psi \left ( X^{\left ( i \right )} ,y^{\left ( i \right )} \right ) \right ]表示袋数m×γm\times \left | \gamma \right |中的第ii个,即(X(1),y(1))\left ( X^{\left ( 1 \right )},y^{\left ( 1 \right )} \right )表示(X1,y1),...,(X(γ),y(γ))\left ( X_1,y_1 \right ),...,\left ( X^{\left ( \left | \gamma \right | \right )},y^{\left ( \left | \gamma \right | \right )} \right ),表示(X1,yγ),...,(X(m×γ),y(m×γ))\left ( X_1,y_{\left | \gamma \right |}\right ),...,\left ( X^{\left ( m\times \left | \gamma \right | \right )} ,y^{\left ( m\times \left | \gamma \right | \right )} \right ),表示(Xm,yγ)\left ( X_m,y_{\left | \gamma \right |} \right ),其中(X(i),y(i))\left ( X^{\left ( i \right )} ,y^{\left ( i \right )}\right )包含nin_i个实例数,即{(x1(i),y(i)),(x2(i),y(i)),...,(xni(i),y(i))}\left \{ \left ( \boldsymbol{x}_{1}^{\left ( i \right )},y^{\left ( i \right )} \right ),\left ( \boldsymbol{x}_{2}^{\left ( i \right )},y^{\left ( i \right )} \right ) ,...,\left ( \boldsymbol{x}_{n_i}^{\left ( i \right )},y^{\left ( i \right )} \right )\right \}
    • 然后,可以从数据集中学习多实例学习函数fMILf_{MIL},因为fMIML(X)={yargyγ(sign[fMIL(X),y]=+1)}f_{MIML}\left ( X^* \right )= \left \{ y|arg_{y\in \gamma}\left (sign[f_{MIL}\left ( X^* \right ),y]= +1 \right ) \right \}。在这里,我们使用MIBOOSTING实现fMILf_{MIL}

相关文章: