二：PCA 和 KPCA理解

PCA 和 KPCA理解

前言
PCA

PCA的作用与要求
PCA中方差的表达

第一步映射后的样本坐标
第二步得出方差表达式

最优化问题：求方差最大值时的v
PCA例子

KPCA

前言

本文中的数据样本都是去中心化的，即可以理解为均值为0。

PCA

本例中是从二维降到一维

PCA的作用与要求

PCA是用于降维的一种方法，在降维后尽可能的保留样本最大的特征，即保证降维后方差最大化。
如下图例子所示所有样本，映射在蓝色的直线上（从二维降到一维），分布最广（用数学语言，就是映射在直线上的样本方差最大化）。
二：PCA 和 KPCA理解

PCA中方差的表达

既然要求降维后方差要最大，首先我们得表示出降维后的方差表达，然后用最优化手段，将其最大化，即找出最优解。

第一步映射后的样本坐标

二：PCA 和 KPCA理解
上图中将第一幅图的其中一个样本，和那条降维后的线单独拿出来，进行剖析。
我们需要表达出样本xj在降维后的坐标，通过高中向量知识可以很容易得出红色向量的长度为||xj||*cosθ，方向为v/||v||。假设v是一个单位向量，式子可以化简为<xj,v>v,前面的内积用线性代数表示就是<xj,v> = (xj)的转置乘上v，后面的v因为是单位正向量所以只是用于区分方向。
到这一步，我们可以表达出降维后的坐标了： vT(xj)（这是一个标量）
需要注意的是化简到这一步有一个条件那就是||v||=1。
得出下图：二：PCA 和 KPCA理解

第二步得出方差表达式

既然有了坐标，我们就可以表达出样本方差并化简成：
二：PCA 和 KPCA理解

最优化问题：求方差最大值时的v

得到了方差后，就需要求出在条件 ||v|| = 1 下（此条件等价于 vT * v = 1），方差最大。所以引入拉格朗日乘子法：
二：PCA 和 KPCA理解
变成解这个式子：

好巧不巧的是：因为我们是要求(vT)Cv的max 由上式可知 Cv = λv，所以就是求(vT)λv = (vT)vλ的最大值，更巧的是 (vT)v TM的等于 1，所以上面就成了求(vT)vλ=λ的最大值。