【发布时间】:2011-11-18 17:37:10
【问题描述】:
我正在尝试使用 cython 加速一些 python 代码,并且我正在使用 cython 的 -a 选项来查看可以改进的地方。我的理解是,在生成的 html 文件中,突出显示的行是调用 python 函数的行 - 对吗?
在下面的简单函数中,我使用缓冲区语法声明了 numpy 数组参数 arr。我认为这允许索引操作完全在 C 中进行,而无需调用 python 函数。但是,cython -a(0.15 版)突出显示了我设置arr 元素值的行,尽管不是我读取其中一个元素的行。为什么会这样?有没有更有效的方式访问 numpy 数组元素?
import numpy
cimport numpy
def foo(numpy.ndarray[double, ndim=1] arr not None):
cdef int i
cdef double elem
for i in xrange(10):
elem = arr[i] #not highlighted
arr[i] = 1.0 + elem #highlighted
编辑:另外,mode 缓冲区参数如何与 numpy 交互?假设我没有更改默认的numpy.array 的order 参数,那么使用mode='c' 总是安全的吗?这真的会对性能产生影响吗?
在 delnan 的评论后编辑:arr[i] += 1 也被突出显示(这就是为什么我首先将其拆分,以查看导致问题的操作部分)。如果我关闭边界检查以简化事情(这与突出显示的内容没有区别),生成的 c 代码是:
/* "ct.pyx":11
* cdef int i
* cdef double elem
* for i in xrange(10): # <<<<<<<<<<<<<<
* elem = arr[i]
* arr[i] = 1.0 + elem
*/
for (__pyx_t_1 = 0; __pyx_t_1 < 10; __pyx_t_1+=1) {
__pyx_v_i = __pyx_t_1;
/* "ct.pyx":12
* cdef double elem
* for i in xrange(10):
* elem = arr[i] # <<<<<<<<<<<<<<
* arr[i] = 1.0 + elem
*/
__pyx_t_2 = __pyx_v_i;
__pyx_v_elem = (*__Pyx_BufPtrStrided1d(double *, __pyx_bstruct_arr.buf, __pyx_t_2, __pyx_bstride_0_arr));
/* "ct.pyx":13
* for i in xrange(10):
* elem = arr[i]
* arr[i] = 1.0 + elem # <<<<<<<<<<<<<<
*/
__pyx_t_3 = __pyx_v_i;
*__Pyx_BufPtrStrided1d(double *, __pyx_bstruct_arr.buf, __pyx_t_3, __pyx_bstride_0_arr) = (1.0 + __pyx_v_elem);
}
【问题讨论】:
-
arr[i] += 1是否突出显示?另外,我相信您可以直接在cython -a生成的 HTML 文档中查看为该特定行生成的代码,也许有助于了解该行发生了哪些 Python API 调用。
标签: python arrays indexing numpy cython