机器学习与模式识别第三章：判别函数

在很多实际问题中，由于样本特征空间的类条件概率密度的形式常常很难确定，利用非参数方法估计需要很大的样本空间，而且随着特征空间位数的增加所需的样本数急剧增加，因此在实际问题中，我们往往不确定某个判别函数类，然后利用样本集确定出判别函数中的未知参数。

线性判别函数法是一种较为简单的判别函数，最简单的是线性函数，它的分界面是超平面，采用线性判别函数所产生的错误率或风险虽然可能比贝叶斯分类器来的大，但是他简单，容易实现，而且需要的计算量和存储量小。因此可以认为线性判别函数是统计模式识别的基本方法之一。

模式识别系统的主要作用 ，判别各个模式所属的类别，对一个两类问题的判别，就是将模式x划分成ω1和ω2两类。
用判别函数分类的概念 两类问题的判别函数（以二维模式样本为例）
若x是二维模式样本x = (x1 x2)T，用x1和x2作为坐标分量，得到模式的平面图：

这时，若这些分属于ω1和ω2两类的模式可用一个直线方程d(x)=0来划分
d(x) = w1x1 + w2x2 + w3 = 0
其中x1、x2为坐标变量，w1、w2、w3为参数方程，则将一个不知类别的模式代入d(x)，有

用判别函数进行模式分类依赖的两个因素
用判别函数进行模式分类依赖的两个因素
（1）判别函数的几何性质：线性的和非线性的函数。
线性的是一条直线；
非线性的可以是曲线、折线等；
线性判别函数建立起来比较简单（实际应用较多）；
非线性判别函数建立起来比较复杂。
（2）判别函数的系数：判别函数的形式确定后，主要就是确定判别函数的系数问题。
只要被研究的模式是可分的，就能用给定的模式样本集来确定判别函数的系数。
n维线性判别函数的一般形式
一个n维线性判别函数的一般形式：

其中w0 = (w1, w2, …, wn)T称为权向量（或参数向量）, x = (x1, x2, …, xn)T。
d(x)也可表示为：
d(x) = wTx
其中，x = (x1, x2, …, xn, 1)T称为增广模式向量，w = (w1, w2, …, wn+1)T称为增广权向量。

两类情况：判别函数d(x)
机器学习与模式识别第三章：判别函数
8. 线性判别函数

例：设有一个三类问题，其判别函数为：
d12(x)= -x1 - x2 + 5，d13(x)= -x1 + 3，d23(x)= -x1 + x2
若x =(4, 3)T，则：d12(x) = -2，d13(x) = -1，d23(x) = -1

机器学习与模式识别第三章：判别函数
分类失败。

在一个10类的模式识别问题中，有3类单独满足多类情况1，其余的类别满足多类情况2。问该模式识别问题所需判别函数的最少数目是多少？
答：将10类问题看成4个多类情况1的问题，那么需要4个判别函数，在第4个类中有7个是多类函数情况2，因此需要21个判别函数，加起来一共25个。
一个三类问题，其判别函数如下：
d1(x)=-x1, d2(x)=x1+x2-1, d3(x)=x1-x2-1
设这些函数是在多类情况1条件下确定的，绘出其判别界面和每一个模式类别的区域。
设为多类情况2，并使：d12(x)= d1(x), d13(x)= d2(x), d23(x)= d3(x)。绘出其判别界面和多类情况2的区域。
设d1(x), d2(x)和d3(x)是在多类情况3的条件下确定的，绘出其判别界面和每类的区域
第一种：

第二种：

第三种：

画的好丑啊！！！