【问题标题】:pyCUDA reduction doesn't workpyCUDA 减少不起作用
【发布时间】:2015-04-15 04:38:06
【问题描述】:

我使用的简化代码基本上与文档中的示例完全相同。下面的代码应该返回2^3 + 2^3 = 16,但它却返回9。我做错了什么?

import numpy
import pycuda.reduction as reduct
import pycuda.gpuarray as gpuarray
import pycuda.autoinit
from pycuda.compiler import SourceModule as module

newzeros = [{1,2,3},{4,5,6}]
gpuSum = reduct.ReductionKernel(numpy.uint64, neutral="0", reduce_expr="a+b", map_expr="1 << x[i]", arguments="int* x")
mylengths = pycuda.gpuarray.to_gpu(numpy.array(map(len,newzeros),dtype = "uint64",))
sumfalse = gpuSum(mylengths).get()
print sumfalse

【问题讨论】:

    标签: python numpy cuda pycuda


    【解决方案1】:

    我刚刚想通了。定义内核时使用的参数列表应该是unsigned long *x,而不是int *x。我在其他任何地方都使用 64 位整数,结果搞砸了。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2021-03-02
      • 1970-01-01
      • 2021-03-07
      • 1970-01-01
      • 1970-01-01
      • 2016-09-05
      • 1970-01-01
      相关资源
      最近更新 更多