理解矩阵
内容大部分摘自孟岩老师博客 http://blog.csdn.net/myan/article/details/647511
《理解矩阵一》
孟岩老师从“空间”谈起,而大多数人最熟悉的空间,毫无疑问就是我们生活在其中的三维空间,从数学上来说,这是一个三维的欧几里德空间。
我们所熟悉的这样一个空间,有一个很重要的性质,就是可以容纳运动,这里所说的运动,是一个点到另一个点的移动(变换),而不是微积分意义上的“连续”性的运动。
这个性质不仅是三维空间所特有的,它是空间的本质,即,容纳运动是空间的本质特征。
因此,不管是什么空间,都必须容纳和支持在其中发生的符合规则的运动(变换)。所以,在某种空间中往往会存在一种相对应的变换,比如拓扑空间中有拓扑变换,线性空间中有线性变换,仿射空间中有仿射变换,这些变换都是对应空间中允许的运动形式。
总结一句话,“空间”是容纳运动的一个对象集合,而变换则对应的空间的运动
接下来,孟岩老师着重讲解了我们熟悉的线性空间(其他空间的分析方法一样)。
既然线性空间也是空间,具有空间的性质,那么有两个需要解决的问题:
1,空间是一个对象集合,那么线性空间是怎样的对象集合?
2,线性空间中的运动如何表示?也就是,线性变换如何表示?
answer1:线性空间中的任何一个对象,通过选取基和坐标的办法,都可以表达为向量的形式
answer2:用矩阵来描述线性空间中任何一个运动(变换),而使某个对象发生对应运动的方法,就是用代表那个运动的矩阵,乘以代表那个对象的向量
总结一句话,在线性空间中选定基之后,向量刻画对象,矩阵刻画对象的运动,用矩阵与向量的乘法施加运动
到这里,终于提到了矩阵,也直接揭示了矩阵的本质,即,矩阵的本质是运动的描述!!
然而向量本身也可以看成是n×1的矩阵,向量表示空间中的对象,矩阵表示空间中的运动,一个空间中的对象和运动可以用相类同的方式表示,这只是巧合么?
《理解矩阵二》
在上一篇中,最后孟岩老师的结论是“矩阵是运动的描述”,需要重申,这里的运动,不是微积分中的连续运动,而是瞬间发生的变化。比如这个时刻在A点,下一个时刻,一下子就“跃迁”到B点,其中不需要经过A点与B点之间的任何一个点,这样的“运动”,或者“跃迁”,是违背我们的日常的经验。所以,可以将结论改成:
矩阵是线性空间里跃迁的描述
或者:
矩阵是线性空间里变换的描述
其中,所谓变换,就是空间里一个点(元素/对象)到另一个点(元素/对象)的跃迁
线性变换的定义:
设有一种变换T,是得对于线性变换V中间任何两个不相同的对象x和y,以及任意实数a和b,有:
T(ax+by) = aT(x) + bT(y),
那么就成T为线性变换。
线性变换究竟是一种什么样的变换?
就是从一个线性空间V的某一点跃迁到另一个线性空间W的另一个点的运动。这句话蕴含着两个意思:
- 一个点不仅可以变换到同一个线性空间的另一点
- 还可以变换到另一个线性空间中的另一个点去
线性变换,可以用一个非奇异矩阵来描述,反之也成立,用一个非奇异矩阵去描述一个变换,一定是一个线性变换。
所谓非奇异,只对方针有意义。(n阶方阵A的行列式不为0,称A为非奇异矩阵或满秩矩阵)
以下只讨论最常用,最有用的一种变换,就是在同一个线性空间之内的线性变换。
基:线性空间里的坐标系
(注意是坐标系,不是坐标值,这两者可是一个“对立矛盾统一体”??)
千呼万唤始出来,矩阵的定义:
矩阵是线性空间中的线性变换的一个描述,在一个线性空间中,只要我们选定一组基,那么对于任何一个线性变换,都能够用一个确定的矩阵来加以描述。
确定矩阵的时候,有一个前提,即“选定一组基”。对于一个线性变换,只要选定一组基,那么就可以找到一个矩阵描述这个线性变换;换一组基,就得到一个不同的矩阵。所有这些矩阵都是这同一个线性变化的描述,但又不是线性变换的本身。
所以,矩阵仅是线性变换的一个描述,选定不同的基,得到的矩阵不同。矩阵非线性变换本身。
那么,我们如何知道两个矩阵是描述的同一个线性变换呢?
相似矩阵:
若矩阵A与B是同一个线性变换的两个不同的描述,则一定能找到一个非奇异矩阵P,使得A,B之间满足这样的关系:
A = P-1BP
所谓相似矩阵,就是同一个线性变换的不同的描述矩阵。
一族相似矩阵都是同一个线性变换的描述。
矩阵P,就是A矩阵所基于的基与B矩阵所基于的基,这两组基之间的一个变换关系。