如何有效地从数组中选择多个切片？

【问题标题】：how to efficiently select multiple slices from an array?如何有效地从数组中选择多个切片？
【发布时间】：2013-03-20 15:22:09
【问题描述】：

给定一个数组

d = np.random.randn(100)

还有一个索引数组

i = np.random.random_integers(low=3, high=d.size - 5, size=20)

我怎样才能有效地创建一个二维数组r

r.shape = (20, 8)

这样对于所有j=0..19，

r[j] = d[i[j]-3:i[j]+5]

在我的例子中，数组非常大（~200000 而不是 100 和 20），所以一些快速的东西会很有用。

【问题讨论】：

【解决方案1】：

您可以创建数据的窗口视图，即(93, 8) 数组，其中[i, j] 项是原始数组的[i+j] 项，如下所示：

>>> from numpy.lib.stride_tricks import as_strided
>>> wd = as_strided(d, shape=(len(d)-8+1, 8), strides=d.strides*2)

您现在可以将所需的切片提取为：

>>> r = wd[i-3]

请注意，wd 只是原始数据的视图，因此它不需要额外的内存。使用任意索引提取 r 的那一刻，数据将被复制。因此，根据您想如何使用 r 数组，您可能希望尽可能地延迟它，或者甚至完全避免它：您始终可以访问行 r[j] 为 wd[j-3] 而不会触发复制。

【讨论】：