特征选择(三)-K-L变换

各个特征(各个分量)对分类来说,其重要性当然是不同的。
舍去不重要的分量,这就是降维

 

聚类变换认为重要的分量就是能让变换后类内距离小的分量

类内距离小,意味着抱团抱得紧。

 

但是,抱团抱得紧,真的就一定容易分类么?

如图1所示,根据聚类变换的原则,我们要留下方差小的分量,把方差大(波动大)的分量丢掉,所以两个椭圆都要向y轴投影,这样悲剧了,两个重叠在一起,根本分不开了。而另一种情况却可以这么做,把方差大的分量丢掉,于是向x轴投影,很顺利就能分开了。因此,聚类变换并不是每次都能成功的

特征选择降维聚类变换集群变换KL变换模式识别

图1

 

摧枯拉朽的K-L变换

K-L变换是理论上“最好”的变换:是均方误差(MSE,MeanSquare Error)意义下的最佳变换,它在数据压缩技术中占有重要地位。

 

聚类变换还有一个问题是,必须一类一类地处理,把每类分别变换,让它们各自抱团。

K-L变换要把所有的类别放在一起变换,希望通过这个一次性的变换,让它们分的足够开。

 

K-L变换认为:各类抱团紧不一定好区分。目标应该是怎么样让类间距离大,或者让不同类好区分。因此对应于2种K-L变换。

 

其一:最优描述的K-L变换(沿类间距离大的方向降维)

首先来看个二维二类的例子,如图2所示。

特征选择降维聚类变换集群变换KL变换模式识别

图2


特征选择降维聚类变换集群变换KL变换模式识别

如果使用聚类变换,特征选择降维聚类变换集群变换KL变换模式识别方向是方差最小的方向,因此降维向特征选择降维聚类变换集群变换KL变换模式识别方向投影,得到2类之间的距离即为2条绿线之间的距离,但是这并不是相隔最远的投影方向。将椭圆投影到特征选择降维聚类变换集群变换KL变换模式识别方向,得到2类之间的距离为2条红线之间的距离。这个方向就是用自相关矩阵的统计平均得到的特征向量特征选择降维聚类变换集群变换KL变换模式识别

设共有M个类别,各类出现的先验概率为

特征选择降维聚类变换集群变换KL变换模式识别

特征选择降维聚类变换集群变换KL变换模式识别表示来自第i类的向量。则第i类集群的自相关矩阵为:

特征选择降维聚类变换集群变换KL变换模式识别

混合分布的自相关矩阵R是:

特征选择降维聚类变换集群变换KL变换模式识别

然后求出R的特征向量和特征值:

特征选择降维聚类变换集群变换KL变换模式识别

将特征值降序排列(注意与聚类变换区别

为了降到m维,取前m个特征向量,构成变换矩阵A

特征选择降维聚类变换集群变换KL变换模式识别

以上便完成了最优描述的K-L变换。

 

为什么K-L变换是均方误差(MSE,MeanSquare Error)意义下的最佳变换?

特征选择降维聚类变换集群变换KL变换模式识别

其中特征选择降维聚类变换集群变换KL变换模式识别表示n维向量y的第j个分量,特征选择降维聚类变换集群变换KL变换模式识别表示第个特征分量。

引入的误差

特征选择降维聚类变换集群变换KL变换模式识别

均方误差为

特征选择降维聚类变换集群变换KL变换模式识别


m+1开始的特征值都是最小的几个,所以均方误差得到最小。

 

以上方法称为最优描述的K-L变换,是沿类间距离大的方向降维,从而均方误差最佳

本质上说,最优描述的K-L变换扔掉了最不显著的特征,然而,显著的特征其实并不一定对分类有帮助。我们的目标还是要找出对分类作用大的特征,而不应该管这些特征本身的强弱。这就诞生了第2种的K-L变换方法。

 

其二:最优区分的K-L变换(混合白化后抽取特征)

针对上述问题,最优区分的K-L变换先把混合分布白化,再来根据特征值的分离程度进行排序。

 

最优区分的K-L变换步骤

首先还是混合分布的自相关矩阵R

特征选择降维聚类变换集群变换KL变换模式识别

然后求出R的特征向量和特征值:

特征选择降维聚类变换集群变换KL变换模式识别

以上是主轴变换,实际上是坐标旋转,之前已经介绍过。

令变换矩阵

特征选择降维聚类变换集群变换KL变换模式识别

则有

特征选择降维聚类变换集群变换KL变换模式识别

这个特征选择降维聚类变换集群变换KL变换模式识别作用是白化R矩阵,这一步是坐标尺度变换,相当于把椭圆整形成圆,如图3所示。

 特征选择降维聚类变换集群变换KL变换模式识别

图3


以二类混合分布问题为例。

特征选择降维聚类变换集群变换KL变换模式识别

分别求出二类的特征向量和特征值,有

特征选择降维聚类变换集群变换KL变换模式识别

二者的特征向量完全相同,唯一的据别在于其特征根,而且还负相关,即如果特征选择降维聚类变换集群变换KL变换模式识别取降序排列时,则特征选择降维聚类变换集群变换KL变换模式识别以升序排列。

为了获得最优区分,要使得两者的特征值足够不同。因此,需要舍弃特征值接近0.5的那些特征,而保留使特征选择降维聚类变换集群变换KL变换模式识别大的那些特征,按这个原则选出了m个特征向量记作

特征选择降维聚类变换集群变换KL变换模式识别

则总的最优区分的K-L变换就是:

特征选择降维聚类变换集群变换KL变换模式识别

相关文章:

  • 2021-05-14
  • 2021-11-10
  • 2022-02-15
  • 2021-08-29
  • 2022-12-23
  • 2021-12-13
  • 2021-11-27
  • 2021-12-30
猜你喜欢
  • 2021-11-14
  • 2021-12-05
  • 2022-12-23
  • 2021-05-26
  • 2022-12-23
  • 2021-08-18
  • 2021-09-13
相关资源
相似解决方案