一、些基本定义
- 线性性:所谓的线性性就是加分和数乘。
-
距离:距离的定义必须满足如下三个条件:
- 非负性:时等号成立。
- 对称性:
- 三角不等式:
-
范数:满足三个条件为范数:
- 非负性:
- 线性性:
- 三角不等式:
- 范数可以看成从到原点的距离;所以由范数可以定义距离,即:,但是距离不可以定义范数因为距离的定义,不满足范数的第二条条件。
-
内积: 为内积的条件:
- 对称性:
- 线性性质: ,
- 正定性:
二、各种空间
1、各种空间关系图
2、线性空间
- 若某个空间中的任意向量线性组合(加法和数乘)形成的新向量仍然属于该空间,则该空间就是线性空间。
- 线性空间中可以找到一组基,它能够通过线性组合得到空间中所有的向量(点)。
3、函数空间
- 一个函数可以看成一个无穷维的向量。
- 对函数按照自变量进行采样,将样本的函数值组成一个向量:
- 如果采样的间隔变得无穷的小,则这个向量就为一个无穷维的向量。
- 所以一个函数空间的内积可以定义为:
- 多元函数:用表示中的一个向量(点),代表函数本身,也就是无穷向量。表示点处的函数值
- 与向量基类似,我们可以使用函数基表示其他函数。与向量基不同的是,在向量空间中我们只需要有限个向量去构造一组向量基,函数空间中则需要无限个基函数。
4、完备性
- 其中完备性的意思就是空间中的极限运算不能跑出该空间,如有理数空间中的 的小数表示,其极限随着小数位数的增加收敛到,但属于无理数,并不在有理数空间,故不满足完备性。
- 一个通俗的理解是把学校理解为一个空间,你从学校内的宿舍中开始一直往外走,当走不动停下来时(极限收敛),发现已经走出学校了(超出空间),不在学校范围内了(不完备了)。希尔伯特就相当于地球,无论你怎么走,都还在地球内(飞出太空除外)
- 一般指函数空间
5、特征值分解
-
特征值:
- 定义:设是阶矩阵,λ是一个实数,若存在维非零向量,使得下式成立: 则称是的一个特征值,是的对应于特征值的特征向量。
- 性质:
- 不同特征值的特征向量线性无关。
- 同一特征值的特征向量的线性组合依然是该特征值的特征向量。
- 不同特征值的特征向量的线性组合依然不再是矩阵A的特征向量。
-
重特征值至多有个线性无关的特征向量。
-
一般矩阵的特征值分解:
- 若是阶矩阵,并且具有个线性无关的特征向量:
- 这些特征向量对应的特征值分别是:特征值可能有重根。
- 则有下面式子成立:
- 记:
- 则有:
-
实对称矩阵性质::
- 实对称矩阵的不同特征值对应的特征向量是正交的
- 实对称矩阵的特征值都是实数,特征向量都是实向量。
- 阶实对称矩阵必可相似对角化(有个线性无关的特征向量),且相似对角阵上的元素即为矩阵本身特征值。
- 若是重特征值,则必有k个线性无关的特征向量。
-
如果矩阵是实对称矩阵,则必定存在一个正交矩阵,使得,即其中是对角矩阵
-
正交矩阵性质::
-
正交矩阵,则
-
正交矩阵,则
-
施密特正交化::
- 设是中的一个线性无关向量组,若令:
- 则就是一个正交向量组。再进行单位化:
- 利用线性无关向量组,构造出一个标准正交向量组的方法,就是施密特正交化方法。
-
由上面公式我们可以看出,都是由线性组合形成的。
-
证明:如果矩阵A是实对称矩阵,则必定存在一个正交矩阵,即
- 这个就是实对称矩阵的特征值分解,上面所有的铺垫都是为了轻松的证明这个定理。
- 假设是阶实对称矩阵,其不重复特征值为:
- 若,则有个不相等的特征值,所有每个特征值都有一个特征向量为:,则他们相互正交。然后由上面的特征值分解方法有:由于,所以为正交矩阵,则,所以有:
- 若,则有重根特征值,对每个重根特征值做下面处理:
- 若λ_i 是k重特征值,则必有个线性无关的特征向量: ,将他们进行施密特正交化得到:,由于是由线性组合形成的,根据特征值性质可知也是的特征向量并且相互正交。- 经过上面处理,相互正交,后面的处理和上一种情况一样。
- 经过上面处理,相互正交,后面的处理和上一种情况一样。
-
现在经过上面的一系列铺垫证明,我们得到这样一个结论:
- 若是阶是对称矩阵,那么A可以被如下分解: 其中:中间特征值于特征向量是对应关系,我展开公式:
- 若是阶是对称矩阵,那么A可以被如下分解: 其中:中间特征值于特征向量是对应关系,我展开公式:
-
为了顺利理解下面的部分,我们需要知道矩阵与线性变换的一个关系:
- 每个矩阵与一个线性变换对应,所以矩阵可以看作是一个映射或一个函数。
- 详细讲述可以参考:https://blog.csdn.net/ACM_hades/article/details/90518653
三、核函数
- 函数可视为一个无穷维向量,那么二元函数就可以可以视为一个无穷维矩阵,这个地方有点抽象,解释如下:
- 假设为的矩阵,为的列向量,则可以通过对与做内积将映射为一个维空间中的(的列向量),所以矩阵就是一个函数:
- 现在我对函数与做内积:这个积分的结果是一个的函数,也是无限维的向量。所以从这个角度讲就是函数空间中的矩阵。
- 假设二元函数满足下面条件,就是核函数(或者叫核矩阵)
- 对称性(对称矩阵):
- 正定性:
- 满足上述条件我们称为对称半正定核函数。
- 特征值与特征函数:与上面一致
- 这样我可以将核函数像是实对称矩阵那样进行特征分解,所以得到下面公式:
- 假设无穷多个特征值为:,对应的无穷多个正交的特征函数为:所以有:
- 也是当前函数空间的一组标准正交组基。即满足:
四、再生核希尔伯特空间
- 也是原函数空间(希尔伯特空间)的一组标准正交组基,现在我们将做为一组正交基,形成新的函数空间叫做RKHS空间(再生核希尔伯特空间),记为空间
- 空间中的任一向量或函数可以表示为基的线性组合: 则函数可以用坐标(系数)表示:,这样内积可以表示为:
- 在空间的这组基下,这样我们可以改写核函数:我们对核函数中的每取一个特定值,都会得到一个的函数,那么我们可以将核函数看作是向量到函数的一个函数,记作:函数的定义域是欧几里得空间,值域为函数空间。
- 那么在空间的坐标表示:
- 则每取一个具体值,都会是一个函数,并且可以得到这个函数在空间的坐标表示,例如:表示的函数为:
- 那么两个函数:的内积为:
- 这就是核的可再生性,即用核函数再生两个核函数的內积。函数空间被称为再生核希尔伯特空间(RKHS)。
- 这个性质是非常好的,因为原本函数之间计算内积需要算无穷维的积分,但是现在只需要算核函数就好了。
五、核技术:
-
上面我们说过如果我们对进行特定值,核函数就变成了一个x的函数,这样我们可以对进行任意取值得到一个的函数:
-
的定义域是欧几里得空间,值域是一个函数空间。就是一个欧几里得空间到函数空间(希尔伯特空间)的映射(函数).并且值域空间中的任意两个函数的内积都可以通过核函数直接算出需要进行无穷积分。
-
这样,我们无需知道这个映射及其值域空间的具体形式,只需要一个对称半正定的核函数,就必然存在映射和其值域空间,使得:这就是Kernel trick。
-
SVM的核技术:
- 我们的原始数据是欧几里得空间的一个向量,当我们的原始数据线性不可分时,我们就希望有一个映射,它能把原始数据映射到一个无穷维的函数空间(希尔伯特空间)中去,使的数据在这个无穷维的空间中变得线性可分。
- 并且在svm的优化中,我们只需要两个样本的内积,那么经过映射后我们也只需要任意两个样本映射后的内积,并不需要这个映射及其值域空间的具体形式。这样问题就变成了我们只要一个对称半正定的核函数就ok了。
参考链接:
- http://songcy.net/posts/story-of-basis-and-kernel-part-1/
- http://songcy.net/posts/story-of-basis-and-kernel-part-2/