【Multi-instance multi-label learning】论文笔记

Multi-instance multi-label learning with application to scene classification.

传统的监督学习

对象由实例（或特征向量）表示并与类标签关联。 $\chi$ ：实例空间（或特征空间）， $\gamma$ ：类标签的集合。从给定的数据集 $\left \{ ({x_1,y_1}),({x_2,y_2}),...,({x_m,y_m}) \right \}$ 中学习一个函数： $f:\chi \rightarrow \gamma$ ，其中 $x_1\in \chi$ 是一个实例， $y_1\in \gamma$ 是 $x_1$ 的已知标记。

多实例多标签学习（MIML）

一个训练示例由多个实例描述，并与多个类标签关联。 $\chi$ ：实例空间， $\gamma$ ：类标签的集合。从给定的数据集 $\left \{ ({X_1,Y_1}),({X_2,Y_2}),...,({X_m,Y_m}) \right \}$ 中学习一个函数 $f_{MIML}:2^\chi→2^\gamma$ ，其中 $X_i\subseteq \chi$ 是一个集合实例 $\left \{x _{1}^{(i)},x _{2}^{(i)},...,x _{n_{i}}^{(i)} \right \},x_{j}^{(i)}\in \chi (j=1,2,...,n_{i})$ ， $Y_i\subseteq \gamma$ 是一组标签 $\left \{y _{1}^{(i)},y _{2}^{(i)},...,y _{l_{i}}^{(i)} \right \},y_{k}^{(i)}\in \gamma(k=1,2,...,l_{i})$ 。这里用 $n_i$ 表示实例数 $\chi_i$ ，用 $l_i$ 表示标签数 $Y_i$ 。

多实例学习

研究了由多个实例描述的真实对象与一个类标签相关联的问题。任务从给定的数据集 $\left \{ ({X_1,y_1}),({X_2,y_2}),...,({X_m,y_m}) \right \}$ 中学习函数 $f_{MIL}:2^\chi \rightarrow \left \{ -1,+1 \right \}$ ，其中 $X _i\subseteq \chi$ 是一组实例 $\left \{x _{1}^{(i)},x _{2}^{(i)},...,x _{n_{i}}^{(i)} \right \},x_{j}^{(i)}\in \chi (j=1,2,...,n_{i})$ ， $y_i \in\left \{ -1,+1 \right \}$ 是 $X_i$ 的标签。

多标签学习

研究了一个实例描述的现实世界对象与多个类标签相关联的问题。任务从给定的数据集 $\left \{ ({x_1,Y_1}),({x_2,Y_2}),...,({x_m,Y_m}) \right \}$ 中学习函数 $f_{MLL}:\chi \rightarrow 2^\gamma$ ，其中 $\chi _i\subseteq \chi$ 是一个实例， $Y_i\subseteq \gamma$ 是一组标签 $\left \{y _{1}^{(i)},y _{2}^{(i)},...,y _{l_{i}}^{(i)} \right \},y_{k}^{(i)}\in \gamma (k=1,2,...,l_{i})$ 。

多实例学习研究输入空间（或实例空间）中的歧义，其中对象具有许多替代输入描述，即实例；
多标签学习研究输出空间（或标签空间）中的歧义，其中对象具有许多替代输出描述，即标签；
MIML同时考虑输入和输出空间中的歧义；

使用多实例学习或多标签学习作为桥梁，通过在传统的监督学习框架中确定MIML的等效性。
方案一：使用多实例学习作为桥梁。
- 将MIML学习任务（即学习功能 $f_{MIML}:2^\chi→2^\gamma$ ）转换为多实例学习（即学习功能 $f_{MIL}:2^\chi ×\gamma\rightarrow \left \{ -1,+1 \right \}$ ）。对于任何 $y\in\gamma$ ，如果 $y\in Y_i$ ，则 $f_{MIL}(X_i,y)=+1$ ，否则为-1。可以根据 $Y^*=\left \{ y|arg_{y\in\gamma} [f_{MIL}(X^*,y)=+1 ]\right \}$ 确定新示例 $X^*$ 的适当标签。
- 将此多实例学习任务进一步转换为传统的有监督学习任务，即在指定如何从 $f_{SISL}\left ( x_{j}^{(i)},y \right )\left ( j=1,...n_i \right )$ 导出 $f_{MIL}\left ( X_i,y \right )$ 的约束下学习函数 $f_{SISL}:\chi \times \gamma\rightarrow \left \{ -1,+1 \right \}$ 。对于任何 $y\in\gamma$ ， $f_{SISL}\left ( x_{j}^{(i)},y \right )=+1$ ，否则为-1。这里的约束条件可以是 $f_{MIL}\left ( X_i,y \right )= sign\left [ \sum _{j=1}^{n_i}f_{SISL}\left ( x_j^{(i)} ,y\right )\right ]$ ，此条件已用于将多实例学习任务转换为传统的有监督学习任务。这里也可以用其他类型的约束。
方案二：使用多标签学习作为桥梁。
- 将MIML学习任务（即学习功能 $f_{MIML}:2^\chi→2^\gamma$ ）转换为多标签学习任务（即学习功能 $f_{MLL}:Z\rightarrow 2^{\gamma}$ ）。对于任何 $z_{i}\in Z$ ，如果 $z_{i}= \phi \left ( X_{i} \right ),\phi :2^{\chi }\rightarrow Z$ ，则 $f_{MLL}\left ( z_{i} \right )=f_{MIML}\left ( X_{i} \right )$ 。可以根据 $Y^{*}= f_{MLL}\left ( \phi \left ( X^{*} \right ) \right )$ 确定新示例 $X^*$ 的适当标签。
- 可以将多标签学习任务进一步转换为传统的有监督学习任务，即学习函数 $f_{SISL}:Z\times \gamma \rightarrow \left \{ -1,+1 \right \}$ 。对于任何 $y\in\gamma$ ，如果 $y\in Y_i$ ，则 $f_{SISL}\left ( z_{i},y \right )=+1$ ，否则为-1。也就是说 $f_{MLL}\left ( z_{i} \right )= \left \{ y|arg_{y\in\gamma}[f_{SISL}\left ( z_{i},y \right )=+1] \right \}$ 。
- 这里的映射可以通过构造聚类来实现，该聚类已用于将多实例包转换为传统的单实例。这里也可以用其他类型的映射。
算法：MIML BOOST（对应方案一）
- 给定任何集合 $\Omega$ ，让 $|\Omega|$ 表示其大小，即 $\Omega$ 中的元素数；给定任何谓词 $\pi$ ，如果 $\pi$ 成立，则 $[[\pi]]$ 为1，否则为0；给定 $\left ( X_{i},Y_{i} \right)$ ，对于任何 $y\in Y$ ，如果 $y\in Y_i$ ，则令 $\Psi \left ( X_{i},y \right )=+1$ ，否则为-1，其中 $\Psi$ 是函数 $\Psi :2^{\chi }\times \gamma \rightarrow \left \{ -1,+1 \right \}$ 。表1为MIML BOOST算法。
- 第一步，将每个MIML示例 $\left ( X_{u},Y_{u} \right )\left ( u=1,2,...,m \right )$ 转换为多实例袋的数量 $\left | \gamma \right |$ 集合，即 $\left \{ \left [ \left ( X_{u},y_{1} \right ),\Psi \left ( X_{u},y_{1} \right ) \right ] , \left[ \left ( X_{u},y_{2} \right ),\Psi \left ( X_{u},y_{2} \right ) \right ] ,...,\left[ \left ( X_{u},y_{\left | \gamma \right |} \right ),\Psi \left ( X_{u},y_{\left | \gamma \right |} \right ) \right ]\right \}$ 。注意， $\left [ \left ( X_{u},y_{v} \right ),\Psi \left ( X_{u},y_{v} \right ) \right ]\left ( v=1,2,...,\left | \gamma \right | \right )$ 是标记的多实例袋，其中 $\left ( X_{u},y_{v} \right )$ 是包含实例数量为 $n_u$ 的袋，即 $\left \{ \left ( x_{1}^{\left ( u \right )},y_{v} \right ) ,\left ( x_{2}^{\left ( u \right )},y_{v} \right ),...,\left ( x_{n_u}^{\left ( u \right )},y_{v} \right )\right \}$ ， $\Psi \left ( X_{u},y_{v} \right )\in \left \{ +1,-1 \right \}$ 是这个袋子的标签。
- 因此，原始MIML数据集将转换为一个多实例数据集，包含袋数 $m\times \left | \gamma \right |$ ，即 $\left \{ \left [ \left ( X_1,y_1 \right ),\Psi \left ( X_1,y_1 \right ) \right ],...,\left [ \left ( X_1,y_{|\gamma|} \right ),\Psi \left ( X_1,y_{|\gamma|} \right ) \right ], \left [ \left ( X_2,y_1 \right ),\Psi \left ( X_2,y_1 \right ) \right ],...,\left [ \left ( X_m,y_{|\gamma|} \right ),\Psi \left ( X_m,y_{|\gamma|} \right ) \right ] \right \}$ 。令 $\left [ \left ( X^{\left ( i \right )} ,y^{\left ( i \right )} \right ),\Psi \left ( X^{\left ( i \right )} ,y^{\left ( i \right )} \right ) \right ]$ 表示袋数 $m\times \left | \gamma \right |$ 中的第 $i$ 个，即 $\left ( X^{\left ( 1 \right )},y^{\left ( 1 \right )} \right )$ 表示 $\left ( X_1,y_1 \right ),...,\left ( X^{\left ( \left | \gamma \right | \right )},y^{\left ( \left | \gamma \right | \right )} \right )$ ，表示 $\left ( X_1,y_{\left | \gamma \right |}\right ),...,\left ( X^{\left ( m\times \left | \gamma \right | \right )} ,y^{\left ( m\times \left | \gamma \right | \right )} \right )$ ，表示 $\left ( X_m,y_{\left | \gamma \right |} \right )$ ，其中 $\left ( X^{\left ( i \right )} ,y^{\left ( i \right )}\right )$ 包含 $n_i$ 个实例数，即 $\left \{ \left ( \boldsymbol{x}_{1}^{\left ( i \right )},y^{\left ( i \right )} \right ),\left ( \boldsymbol{x}_{2}^{\left ( i \right )},y^{\left ( i \right )} \right ) ,...,\left ( \boldsymbol{x}_{n_i}^{\left ( i \right )},y^{\left ( i \right )} \right )\right \}$ 。
- 然后，可以从数据集中学习多实例学习函数 $f_{MIL}$ ，因为 $f_{MIML}\left ( X^* \right )= \left \{ y|arg_{y\in \gamma}\left (sign[f_{MIL}\left ( X^* \right ),y]= +1 \right ) \right \}$ 。在这里，我们使用MIBOOSTING实现 $f_{MIL}$ 。