numpy/scipy 特征分解的不稳定结果答案

【问题标题】：erratic results for numpy/scipy eigendecompositionsnumpy/scipy 特征分解的不稳定结果
【发布时间】：2013-01-19 15:38:43
【问题描述】：

我发现 scipy.linalg.eig 有时会给出不一致的结果。但不是每次。

>>> import numpy as np
>>> import scipy.linalg as lin
>>> modmat=np.random.random((150,150))
>>> modmat=modmat+modmat.T  # the data i am interested in is described by real symmetric matrices
>>> d,v=lin.eig(modmat)
>>> dx=d.copy()
>>> vx=v.copy()
>>> d,v=lin.eig(modmat)
>>> np.all(d==dx)
False
>>> np.all(v==vx)
False
>>> e,w=lin.eigh(modmat)
>>> ex=e.copy()
>>> wx=w.copy()
>>> e,w=lin.eigh(modmat)
>>> np.all(e==ex)
True
>>> e,w=lin.eigh(modmat)
>>> np.all(e==ex)
False

虽然我不是最伟大的线性代数向导，但我确实理解特征分解本质上会受到奇怪的舍入误差的影响，但我不明白为什么重复计算会导致不同的值。但我的结果和可重复性各不相同。

问题的本质是什么——嗯，有时结果不同，有时则不然。以下是一些示例：

>>> d[1]
(9.8986888573772465+0j)
>>> dx[1]
(9.8986888573772092+0j)

~3e-13 的上述差异似乎并不是什么大问题。相反，真正的问题（至少对于我目前的项目而言）是一些特征值似乎无法就正确的符号达成一致。

>>> np.all(np.sign(d)==np.sign(dx))
False
>>> np.nonzero(np.sign(d)!=np.sign(dx))
(array([ 38,  39,  40,  41,  42,  45,  46,  47,  79,  80,  81,  82,  83,
    84, 109, 112]),)
>>> d[38]
(-6.4011617320002525+0j)
>>> dx[38]
(6.1888785138080209+0j)

MATLAB中的类似代码似乎没有这个问题。

【问题讨论】：

我尝试使用 NumPy 1.6.1 / SciPy 0.10.1 重现此内容，但不能。
我使用的是 numpy 1.6.1 和 scipy 0.10.0。此外，当我不使用 copy() 时，我无法产生此错误（但它确实存在于我较大的应用程序中，其中类似于 copy() 正在发生的事情）。这并不意味着什么，因为它令人难以置信的不一致。

标签： numpy scipy eigenvalue

【解决方案1】：

特征值分解满足 A V = V Lambda，这是可以保证的——例如，特征值的顺序不是。

回答你问题的第二部分：

现代编译器/线性代数库生成/包含执行不同操作的代码取决于数据是否在内存中对齐（例如）16 字节边界。这会影响计算中的舍入误差，因为浮点运算是以不同的顺序完成的。如果算法（此处为 LAPACK/xGEEV）在这方面不能保证数值稳定性，则舍入误差的微小变化会影响诸如特征值排序之类的事情。

（如果你的代码对这样的事情敏感，那是不正确的！在不同的平台或不同的库版本上运行它会导致类似的问题。）

结果通常是准确定的 --- 例如，您会得到 2 个可能的结果之一，这取决于数组是否恰好在内存中对齐。如果您对对齐方式感兴趣，请查看A.__array_interface__['data'][0] % 16。

【讨论】：

除了解释之外，在此处包含问题的解决方案将非常有用。我不知道如何/在哪里使用A.__array_interface__['data'][0] % 16，基本上，鉴于这是我的问题，我该如何更改我的代码以使其不敏感？

【解决方案2】：

我认为您的问题是您期望以特定顺序返回特征值，但它们的结果并不总是相同。对它们进行排序，然后您就可以上路了。如果我运行您的代码以使用eig 生成d 和dx，我会得到以下信息：

>>> np.max(d - dx)
(19.275224236664116+0j)

但是……

>>> d_i = np.argsort(d)
>>> dx_i = np.argsort(dx)
>>> np.max(d[d_i] - dx[dx_i])
(1.1368683772161603e-13+0j)

【讨论】：

啊。这不是完全正确的答案，但它足够接近，它为我指明了正确的方向。我的程序中发生的事情是，在我的代码中的其他地方，我在它们不存在的位置索引特征向量。它确实帮助我修复了我的错误（非常感谢），但它没有解释我提出的问题，这就是为什么这个计算在多次运行时会提供不同的答案——或不同的顺序。也就是说，好吧，特征值不能保证按任何特定顺序排列，但如果你给它与输入相同的矩阵，为什么它们会改变？