【发布时间】:2015-11-23 19:48:46
【问题描述】:
我有三个 numpy 数组:
X:3073 x 49000 矩阵 W:10 x 3073 矩阵 y:49000 x 1 向量
y 包含 0 到 9 之间的值,每个值代表W 中的一行。
我想将X 的第一列添加到W 中由y 中的第一个元素给出的行中。 IE。如果y 的第一个元素是3,则将X 的第一列添加到W 的第四行。然后将X的第二列添加到y中第二个元素给定的W中的行中,以此类推,直到X中的所有列都添加到@指定的W中的行中987654338@,表示总共增加了49000行。
W[y] += X.T 对我不起作用,因为这不会在W 的一行中添加多个向量。
请注意:我只是在寻找矢量化解决方案。 IE。没有 for 循环。
编辑:为了澄清,我将添加一个小矩阵大小的示例,该示例改编自萨尔瓦多·达利(Salvador Dali)的以下示例。
In [1]: import numpy as np
In [2]: a, b, c = 3, 4, 5
In [3]: np.random.seed(0)
In [4]: X = np.random.randint(10, size=(b,c))
In [5]: W = np.random.randint(10, size=(a,b))
In [6]: y = np.random.randint(a, size=(c,1))
In [7]: X
Out[7]:
array([[5, 0, 3, 3, 7],
[9, 3, 5, 2, 4],
[7, 6, 8, 8, 1],
[6, 7, 7, 8, 1]])
In [8]: W
Out[8]:
array([[5, 9, 8, 9],
[4, 3, 0, 3],
[5, 0, 2, 3]])
In [9]: y
Out[9]:
array([[0],
[1],
[1],
[2],
[0]])
In [10]: W[y.ravel()] + X.T
Out[10]:
array([[10, 18, 15, 15],
[ 4, 6, 6, 10],
[ 7, 8, 8, 10],
[ 8, 2, 10, 11],
[12, 13, 9, 10]])
In [11]: W[y.ravel()] = W[y.ravel()] + X.T
In [12]: W
Out[12]:
array([[12, 13, 9, 10],
[ 7, 8, 8, 10],
[ 8, 2, 10, 11]])
问题是BOTH将 X 中的第 0 列和第 4 列添加到 W 中的第 0 行,以及将 X 中的第 1 列和第 2 列都添加到 W 中的第 1 行。
因此,期望的结果是:
W = [[17, 22, 16, 16],
[ 7, 11, 14, 17],
[ 8, 2, 10, 11]]
【问题讨论】:
-
“无循环”是速度问题还是编程挑战问题?
-
这是一个编程挑战问题,受速度驱动。 IE。就我而言,这是一个编程挑战,但我不能使用循环的原因是为了练习编写更高性能的代码。
标签: python numpy matrix vectorization