【问题标题】:How to calculate euclidean distance between pair of rows of a numpy array如何计算numpy数组的行对之间的欧几里得距离
【发布时间】:2017-09-08 02:01:53
【问题描述】:

我有一个numpy 数组,例如:

import numpy as np
a = np.array([[1,0,1,0],
             [1,1,0,0],
             [1,0,1,0],
             [0,0,1,1]])

我想在每对行之间计算euclidian distance

from scipy.spatial import distance
for i in range(0,a.shape[0]):
    d = [np.sqrt(np.sum((a[i]-a[j])**2)) for j in range(i+1,a.shape[0])]
    print(d)

[1.4142135623730951, 0.0, 1.4142135623730951]

[1.4142135623730951, 2.0]

[1.4142135623730951]

[]

由于我必须在一个巨大的 numpy 数组上运行此代码,因此有没有更好的 Pythonic 方式来执行此操作?

【问题讨论】:

  • 这些点的尺寸是任意的,还是总是4d?
  • 你看了吗:distance.pdist?这应该解决它:distance.pdist(a)。最终的输出应该是什么样的?
  • @Divakar 在所有行向量对之间的欧几里得距离中我想要k个最远的向量。
  • @divakar 先生,成功了

标签: python numpy euclidean-distance


【解决方案1】:

为了完整起见,einsum 通常用于计算距离。

a = np.array([[1,0,1,0],
         [1,1,0,0],
         [1,0,1,0],
         [0,0,1,1]])

b = a.reshape(a.shape[0], 1, a.shape[1])

np.sqrt(np.einsum('ijk, ijk->ij', a-b, a-b))

array([[ 0.        ,  1.41421356,  0.        ,  1.41421356],
       [ 1.41421356,  0.        ,  1.41421356,  2.        ],
       [ 0.        ,  1.41421356,  0.        ,  1.41421356],
       [ 1.41421356,  2.        ,  1.41421356,  0.        ]])

【讨论】:

    【解决方案2】:

    我使用了itertools.combinationsnp.linalg.norm的差分向量(这是欧几里得距离):

    import numpy as np
    import itertools
    a = np.array([[1,0,1,0],
                  [1,1,0,0],
                  [1,0,1,0],
                  [0,0,1,1]])
    
    print([np.linalg.norm(x[0]-x[1]) for x in itertools.combinations(a, 2)])
    

    为了理解,请查看docs 中的此示例:
    combinations('ABCD', 2) 给出AB AC AD BC BD CD。在您的情况下,ABCD 是矩阵 a 的行,因此上述代码中出现的术语 x[0]-x[1] 是行中向量的差向量a.

    【讨论】:

      【解决方案3】:

      就更“优雅”的东西而言,您始终可以使用 scikitlearn 成对欧式距离:

      from sklearn.metrics.pairwise import euclidean_distances
      euclidean_distances(a,a)
      

      具有与单个数组相同的输出。

      array([[ 0.        ,  1.41421356,  0.        ,  1.41421356],
             [ 1.41421356,  0.        ,  1.41421356,  2.        ],
             [ 0.        ,  1.41421356,  0.        ,  1.41421356],
             [ 1.41421356,  2.        ,  1.41421356,  0.        ]])
      

      【讨论】:

      • 我认为它给了我每对点之间的欧几里德距离,但我希望它在每对行之间。考虑一行代表一个一维向量。
      • 很抱歉我忘了在我的问题中提到一行是一个一维向量。
      • 那行得通。谢谢你。我弄错了。每个条目是 mXn 数组的第 i 行和第 j 行之间的距离,其中 i
      猜你喜欢
      • 2015-09-23
      • 2010-11-26
      • 2012-11-15
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多