这一部分我们关注正的矩阵,矩阵中的每个元素都大于零。一个重要的事实:最大的特征值是正的实数,其对应的特征向量也如是。最大的特征值控制着矩阵 AA 的乘方。

线性代数之——马尔科夫矩阵

假设我们用 AA 连续乘以一个正的向量 u0=(a,1a)\boldsymbol u_0=(a, 1-a)

线性代数之——马尔科夫矩阵

kk 步后我们得到 Aku0A^k\boldsymbol u_0,这些向量 u1,u2,u3,\boldsymbol u_1,\boldsymbol u_2, \boldsymbol u_3,\cdots会接近于一个稳定状态 u=(0.6,0.4)\boldsymbol u_\infty=(0.6, 0.4)。这个最终的结果不依赖于输入向量:对每一个 u0\boldsymbol u_0 我们都收敛到相同的 u\boldsymbol u_\infty。稳定状态方程 Au=uA\boldsymbol u_\infty=\boldsymbol u_\infty 说明 u\boldsymbol u_\infty 是对应于特征值为 1 的一个特征向量。

线性代数之——马尔科夫矩阵

乘以矩阵 AA 后的确不会改变 u\boldsymbol u_\infty,但这依然不能解释为什么所有的 u0\boldsymbol u_0 都会变成 u\boldsymbol u_\infty。让我们来看另外一个例子,它可能有一个稳定状态,但却不是总能到达。

线性代数之——马尔科夫矩阵

在这种情况下,我们的起始向量为 u0=(0,1)\boldsymbol u_0=(0, 1),然后我们得到 u1=(0,2)\boldsymbol u_1=(0, 2)u2=(0,4)\boldsymbol u_2=(0, 4),第二个元素每次都会加倍。用特征值的语言来说,矩阵的特征值为 λ1=1\lambda_1=1λ2=2\lambda_2=2,输入向量在不稳定特征向量方向的分量每次都乘以了 λ2=2\lambda_2=2,这会导致发散。

我们讨论矩阵的两个特殊属性来使得稳定状态一定可以达到,这两个属性定义了马尔科夫矩阵,上面的 AA 就是一个例子。

马尔科夫矩阵满足:1. 每个元素是非负的;2. 每列元素相加等于 1。

如果 AA 是马尔科夫矩阵,那么我们立马就有:

  • 乘以一个非负向量 u0\boldsymbol u_0 我们仍热得到一个非负向量 u1=Au0\boldsymbol u_1=A\boldsymbol u_0
  • 如果向量 u0\boldsymbol u_0 元素相加为 1,那么 u1=Au0\boldsymbol u_1=A\boldsymbol u_0 的元素相加也为 1

线性代数之——马尔科夫矩阵

假设丹佛市汽车出租的起始比例为 0.02,丹佛市之外的比例为 0.98。每个月,丹佛市 80% 的汽车留在本地,20% 流出,市外有 5% 的汽车流进,95% 的汽车还留在市外,那么我们有

线性代数之——马尔科夫矩阵

注意到 0.065+0.935=1,所有的汽车都被统计了,总量始终为 1。

线性代数之——马尔科夫矩阵

这部分涉及到矩阵的乘方,我们首先想到的就是要对矩阵进行对角化 A=SΛS1A=S\Lambda S^{-1},然后 Ak=SΛkS1A^k=S\Lambda^k S^{-1}

线性代数之——马尔科夫矩阵

线性代数之——马尔科夫矩阵

上面的方程向我们展示实际发生了什么,特征值为 1 的特征向量是稳定状态,另一个特征向量随着迭代次数的增加逐渐消失。步数越多,我们就越接近于 u=(0.2,0.8)\boldsymbol u_\infty=(0.2, 0.8)。在极限情况下,20% 的汽车在丹佛市 80% 的汽车在市外。

线性代数之——马尔科夫矩阵

由于 AA 的每一列相加等于1,所以 AIA-I 的每一列相加等于 0,这也就是说 AIA-I 的行是相关的,其行列式为零,所以 1 是 AA 的一个特征值。如果有特征值大于 1,那么乘方后 AkA^k 元素值会增加,但 AkA^k 仍然是一个马尔科夫矩阵,其元素值非负且每列和为 1,所以这不可能发生,没有特征值绝对值大于 1。

当还有其它特征值的绝对值为 1时,我们要特别注意。

线性代数之——马尔科夫矩阵

这个矩阵每次把丹佛市的汽车都送到外面,同时把外面的汽车都送进来,矩阵的乘方要么是本身要么是恒等矩阵,没有稳定状态。假设矩阵及其乘方的元素严格限制为都是正数,不允许有零出现,那么其余特征值严格小于 1,肯定可以达到稳定状态。

获取更多精彩,请关注「seniusen」!
线性代数之——马尔科夫矩阵

相关文章: