Fisher判别 - 爱码网

距离判别法首先根据已知分类的数据，分别计算出各类的重心。再根据新个体到每类的距离（即新个体与各类重心的距离，可采用欧氏距离或者马氏距离等等），根据最短的距离确定分类情况。
问题描述：
Fisher判别

Fisher判别
Note: 第一个等式是矩阵的写法。

Fisher判别

Note: 矩阵的写法。

Fisher判别

协方差矩阵：对n个维度，任意两个维度都计算一个协方差，组成矩阵

具体见协方差矩阵

Fisher判别的基本思想：
希望投影后的一维数据满足：

Fisher判别

我们的目标是求出 $y=w^Tx$ 这条直线。因此求 $w$
所以我们投影降维，将均差、离散度写成有关 $w$ 的函数。
我们希望类间距大，类内小；所以，目标求 $w$ 为多少时，式子达到最大值。

给定训练样例集，设法将样例投影到一条直线上，使得同类样例的投影点尽可能接近、不同类样例的投影点尽可能远离。在对新样本进行分类时，将其投影到同样的这条直线上，再根据新样本投影点的位置来确定它的类别
Fisher判别

$y=w^Tx$ 就是要投影到的直线

$(\mu_1-\mu_2)^2=(w^Tm_2-w^Tm_1)^2$
将原始空间的均值m1，m2投影后( $\mu_1=w^Tm_1$ )得到在直线上的 $\mu_1$ 和 $\mu_2$

按照方差分析里的思想，应该把各组内的偏差相加，再把各组的偏差总和相加。
Fisher判别

离散度矩阵定义为：
Fisher判别
各组内的偏差相加： 样本与均值差距

因此， $J_F(w)$ 下面的式子：
$\sigma_1^2+\sigma_2^2=w^TS_1w+w^TS_2w=w^T(S_1+S_2)w$

各组的偏差总和相加
Fisher判别

最大化上述式子得到当前 $w_{op}$
Fisher判别