有没有办法让列表处理和 np.array 一样快？答案

【问题标题】：Is there a way to make list processing as fast as np.array?有没有办法让列表处理和 np.array 一样快？
【发布时间】：2021-01-27 16:27:55
【问题描述】：

我目前正在替换我编写的一些代码，假设输入是 numpy 数组，因此它将任意列表作为输入。不幸的是，到目前为止我制作的解决方案比原始代码慢得多。有人可以建议我如何恢复原始解决方案的速度吗？

该代码应该为上三角矩阵表示生成一个布尔索引。如果没有输入检查和类似的东西，这就是代码的核心：

一些导入和示例输入：

import numpy as np
descriptor = list(range(100))
descriptor_arr = np.array(descriptor)
value = [0, 2, 13, 14, 11, 23, 45, 16]

这是我当前基于列表的版本：

def get_idx_slow(descriptor, value):
    ix, iy = np.triu_indices(len(descriptor), 1)
    pattern_in_value = [p in value for p in descriptor]
    return [(pattern_in_value[idx_x] & pattern_in_value[idx_y]) for idx_x, idx_y in zip(ix, iy)]

这是之前基于数组的版本：

def get_idx_fast(descriptor, value):
    ix, iy = np.triu_indices(len(descriptor), 1)
    selection_x = np.any(np.array([descriptor[ix] == v for v in value]), axis=0)
    selection_y = np.any(np.array([descriptor[iy] == v for v in value]), axis=0)
    return selection_x & selection_y

我的计时结果：

%timeit get_idx_slow(descriptor, value)
1.2 ms ± 33.6 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)

%timeit get_idx_fast(descriptor_arr, value)
217 µs ± 1.88 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)

【问题讨论】：

这可能很难或不可能。 numpy 高度优化并利用多处理和/或向量指令。

标签： python arrays list numpy

【解决方案1】：

这绝对是惰性解决方案，只是将慢函数中的列表转换为数组，调用另一个函数，然后再转换回列表。它似乎相当有效。

更新：

def get_idx_slow(descriptor, value):
    return get_idx_fast(np.asarray(descriptor), value).tolist()

结果：

%timeit get_idx_slow_orig(descriptor, value)
892 µs ± 15.3 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)

%timeit get_idx_slow(descriptor, value)
182 µs ± 1.11 µs per loop (mean ± std. dev. of 7 runs, 10000 loops each)

%timeit get_idx_fast(descriptor_arr, value)
150 µs ± 1.21 µs per loop (mean ± std. dev. of 7 runs, 10000 loops each)

【讨论】：

是的，如果没有其他快速解决方案，我可能会尝试摆脱这种情况。在这里使用列表而不是数组的整个想法当然是为了避免任意对象的数组，但是 np.array 在这里可以处理令人惊讶的许多变体......如果出现一些优化的解决方案，将保持打开状态