前言

线性代数这门课基本是理工科学生本科入学后最先学的数学工具之一。也是在考研时,数一、数二、数三的必考科目之一。

但是在本科时,我完全将线性代数作为一个解题工具,这也造成了理论与实践上的鸿沟。后来读研,接触到了量子计算(当然也只是初窥门径),发现正确理解线性代数所表达的几何意义,是学好量子计算,当然也是学好理工科其他研究领域的重要保证。所以在这里整理下我对线性代数的一个理解,既是理清思路,也是进行交流。

线性代数描述了啥

在我的理解中,数学是描述这个世界的工具。但是世界是复杂的,无法完美的将世界进行建模,通常是对世界中的实体、现象等进行抽象、总结、归纳,而采用的工具就是各种数学工具,线性代数就是其中之一。

线性代数是研究向量空间(线性空间)的工具。在一个向量空间中,在没有任何定义的情况下,它只有一个零点OO

线性代数的最基本的研究对象是向量,这个向量是向量空间中的一个对象,向量在这个向量空间中表示如图所示,可以看出向量a\vec a根部是空间中零点OO的位置。

线性代数初探(1)
线性代数最基本的运算是向量加法和数乘,空间中一个向量a\vec a可以由这个空间中的其他向量经过向量加法和数乘运算来线性表示,如下图所示。

线性代数初探(1)

如果想要对空间中向量a\vec a进行描述,我们需要定义一个标尺,也就是这个向量空间中的基。向量空间的一组基是张成(span)该空间的一组线性无关向量集。

线性无关是指,在这个集合中,任意一个向量都无法用集合中其他向量来线性表示,即不存在一组数{α1,...,αn}\{ \alpha_1,...,\alpha_n\},使得vi=α1v1+...+αi1vi1+αi+1vi+1+...+αnvn\vec v_i=\alpha_1\vec v_1+...+\alpha_{i-1}\vec v_{i-1}+\alpha_{i+1}\vec v_{i+1}+...+\alpha_n\vec v_n成立。也就是说,在这个集合中,每个向量都是独特的,对张成一个向量空间没有一个是多余的。如下图所示,假如定义了一组基b\vec bc\vec cd\vec d来描述这个二维的向量空间,发现d=1b+0c\vec d=-1\vec b+0\vec c,即d\vec d可以由b\vec bc\vec c来线性表示,可以看出b\vec bd\vec d中有一个对定义这个向量空间是没有意义的,是多余的,因为只用b\vec bc\vec c就可以表示这个二维向量空间中所有的向量。

线性代数初探(1)

如果对向量空间表示为span{b,c}span\{\vec b,\vec c\},这意味着选取的一组基为b,c\vec b,\vec c。为了简化说明,定义他们两个是单位向量,表示为
b=[01],c=[10] \vec b=\begin{bmatrix} 0 \\ 1\end{bmatrix},\vec c=\begin{bmatrix} 1 \\ 0\end{bmatrix}
a\vec a表示为
a=3b+2c=3[01]+2[10]=[23] \begin{aligned} \vec a &=3\vec b+2\vec c\\ &=3\begin{bmatrix} 0 \\ 1\end{bmatrix}+2\begin{bmatrix} 1 \\0\end{bmatrix}\\ &=\begin{bmatrix} 2 \\ 3\end{bmatrix}\\ \end{aligned}
当然在这个空间中还会存在其他不同的基,如下图所示,可以发现只要一组向量是线性无关的,就可以用来做这个空间的基。

线性代数初探(1)
如果使用右边的基来表示a\vec a,可以写为
a=2c+3d=2[10]+3[01]=[23] \begin{aligned} \vec a &=2\vec c+3\vec d\\ &=2\begin{bmatrix} 1 \\ 0\end{bmatrix}+3\begin{bmatrix} 0 \\-1\end{bmatrix}\\ &=\begin{bmatrix} 2 \\ -3\end{bmatrix}\\ \end{aligned}
发现同样是空间中的一个向量,在采用不同的基来描述时,它们的表示是不一样的,但这并不意味着这两种表示描述的是空间中不一样的对象。可以把这两种基看作是看待同一对象的不同角度。

举例来说,在自然语言处理中,单词的表示是一条稠密的向量,即词嵌入表示(word embedding)。如果将这个词向量放入一个名为语义空间的三维向量空间中表示,那么这个向量空间的基可以定义为不同的语义,如图所示

线性代数初探(1)
如果这个空间使用另外的一组基来表示,如下图所示,这组基定义的空间表示为一个情感分析的空间,每个基向量表示一种情感,那么同样的向量a\vec a在这个空间中表示一个词的情感,在以后介绍量子测量相关知识时,还会再提到这两张图,以及相关的后续计算。
线性代数初探(1)

向量空间

上面大致介绍了线性代数的研究对象和基本运算,以及它和向量空间的关系,现在介绍一下向量空间要满足的要求。

封闭性公理:
v,uVλ,μKv+uVλvV \forall \vec v,\vec u \in V\\ \forall \lambda,\mu \in K\\ \vec v+\vec u \in V\\ \lambda \vec v \in V

加法公理:
u+(v+w)=(u+v)+wv+w=w+v0V,使vV,v+0=vvV,uV,使v+u=0 \vec u+(\vec v+\vec w)=(\vec u+\vec v)+\vec w\\ \vec v+\vec w =\vec w+\vec v\\ \exists \vec 0 \in V, 使\forall \vec v \in V,有\vec v+\vec 0=\vec v(唯一零元)\\ \forall \vec v \in V,\exists \vec u \in V,使\vec v+\vec u=\vec 0(唯一负元)
数乘公理:
λ×(μv)=(λ×μ)vλ(v+u)=λv+λu(λ+μ)v=λv+μv \lambda \times(\mu \vec v)=(\lambda \times \mu)\vec v\\ \lambda (\vec v+\vec u)=\lambda \vec v+\lambda \vec u\\ (\lambda + \mu)\vec v=\lambda \vec v+\mu \vec v
满足以上条件的空间可以被称为向量空间,在向量空间中零点是唯一的,而且空间中的加法和数乘运算结果不会超出空间范围。

相关文章: