线性判别分析(LDA)模型

基本原理

给定训练样集，设法将样例投影到一条直线上，使得同类样例的投影点尽可能的接近，异类样本点尽可能地远离；在对新样本进行分类的时候，将其投影到同样的这条线上面，根据投影点的位置来确定样本的类别。

公式推导过程

二维示意图如下：
线性判别分析(LDA)模型
二分类投影函数：y=wTx
类别i的原始中心点为：(Di表示属于类别i的点）：mi=1ni∑x∈Dix
类别投影后的中心点为：m˜i=wTmi
衡量类别i投影后，类别点之间的分散程度（方差）为：s˜i=∑y∈Yi(y−m˜i)2
则LDA投影到w后的损失函数：J(w)=|m˜1−m˜2|2s˜12+s˜22·······1
优化目标：类别中心点之间的距离越远越好，同类别数据分散程度越小越好；所以损失函数J(w)的分子尽量小，分母尽量大
将m˜i和s˜i分别带入1式，得到如下方程：

J (w) = w T (m 1 - m 2) (m 1 - m 2) T w \sum y \in Y 1 w T (x - m 1) (x - m 1) T w + \sum y \in Y 2 w T (x - m 2) (x - m 2) T w

定义：
类内散度：Si=∑y∈YiwT(x−mi)(x−mi)Tw
类间散度：SB=(m1−m2)(m1−m2)T
则优化目标J(w)为：

J (w) = w T S B w w T S w w ， 其 中 S w = S 1 + S 2

令wTSww=1则上式等价于：

m i n w - w T S B w

s . t . w T S w w = 1

拉格朗日乘子法求解：
将有约束的优化问题变为无约束的问题,上述问题可以用拉格朗日乘子法求解：

f (w) = - w T S B w - λ (1 - w T S w w)

对f(w)求导：

d f (w) d w = 2 S B w - 2 λ S w w = 0

得到：

S B w = λ S w w

因此，转化为一个求特征值的问题，我们求出第i大的特征向量，就是对应的wi了。