使用准系统版本的列表追加:
def foo1(N):
alist = []
for _ in range(N):
alist.append([1,2,3,4,5,6])
return np.array(alist)
与 N 平滑地缩放时间
In [4]: timeit foo1(100)
10000 loops, best of 3: 123 µs per loop
In [5]: timeit foo1(1000)
1000 loops, best of 3: 1.23 ms per loop
In [6]: timeit foo1(10000)
100 loops, best of 3: 12.3 ms per loop
In [7]: timeit foo1(100000)
10 loops, best of 3: 129 ms per loop
In [8]: timeit foo1(1000000)
1 loop, best of 3: 1.29 s per loop
In [9]: timeit foo1(10000000)
1 loop, best of 3: 12.9 s per loop
列表附加可能会因列表较大而减慢速度。列表使用缓冲区来保存指针,以及一些增长空间。当它超出那个空间时,它必须得到更多。如果它不能“就地”扩展,它将不得不请求新空间并复制所有指针。对于接近填充内存的非常大的列表,这可能会减慢速度。随着时间安排从 123 到 129,我可能会看到这方面的暗示
def foo2(N):
out = np.zeros((N,6),int)
for i in range(N):
out[i,:] = [1,2,3,4,5,6]
return out
时间也随 N 缩放,是列表情况的两倍:
In [15]: timeit foo2(100)
1000 loops, best of 3: 242 µs per loop
In [16]: timeit foo2(1000)
100 loops, best of 3: 2.52 ms per loop
In [17]: timeit foo2(10000)
10 loops, best of 3: 24.6 ms per loop
In [18]: timeit foo2(100000)
1 loop, best of 3: 249 ms per loop
In [19]: timeit foo2(1000000)
1 loop, best of 3: 2.52 s per loop
In [20]: timeit foo2(10000000)
1 loop, best of 3: 25.2 s per loop
在最后一个维度上迭代在时间上没有区别
def foo3(N):
out = np.zeros((6,N),int)
for i in range(N):
out[:,i] = [1,2,3,4,5,6]
return out
在一次只分配/创建 6 个元素的同时迭代 1000 次是很糟糕的 numpy 实践。如果必须迭代,最好循环几次,每次都进行大型操作。例如 6 个循环,包含 1000 个项目数组。
如果我将迭代向下移动到已编译的代码,时间会快得多
def foo4(N):
out = np.zeros((N,6),int)
out[...] = [1,2,3,4,5,6]
return out
In [28]: timeit foo4(1000)
.... cached.
10000 loops, best of 3: 20.4 µs per loop
In [29]: timeit foo4(100000)
1000 loops, best of 3: 1.45 ms per loop
您谈论保存矩阵,甚至分配np.matrix。那么让我们看看有什么效果:
def foo1m(N):
alist = []
for _ in range(N):
alist.append(np.matrix([1,2,3,4,5,6]).T)
return np.concatenate(alist, axis=1)
def foo2m(N):
out = np.matrix(np.zeros((6,N),int))
for i in range(N):
out[:,i] = np.matrix([1,2,3,4,5,6]).T
return out
In [62]: timeit foo1(1000)
1000 loops, best of 3: 1.32 ms per loop
In [63]: timeit foo1m(1000)
100 loops, best of 3: 18 ms per loop
In [64]: timeit foo2(1000)
100 loops, best of 3: 2.75 ms per loop
In [65]: timeit foo2m(1000)
10 loops, best of 3: 28.2 ms per loop
这使得每次/迭代时间增加了 10 倍。 matrix 是 ndarray 的子类,需要更多处理(强制其为 2d 等)。