【发布时间】:2017-12-22 12:09:40
【问题描述】:
我最近购买了一个 P100 GPU,希望能加快并行代码的速度,并且需要一些帮助来决定如何将 MATLAB 代码转换为 CUDA 代码(我已经远离了普通的 gpuarrays MATLAB)。我已经对 .ptx 内核和 MEX-文件进行了试验,但两者都遇到了一些障碍。
并行代码具有元素取幂、元素乘法以及 FFT 和 IFFT 调用。它还包含复数。
从 CUDA 内核或 MEX CUDA 文件编译的 .ptx 文件是否更易于使用,并且允许我执行必要的 FFT、IFFT、exp 和 mult 调用?
【问题讨论】:
-
你试过 cuFFT (docs.nvidia.com/cuda/cufft/index.html) 吗?
-
我相信 cuFFT 内置于 MATLAB 的 gpuArrray fft 调用中。如果是这样的话,这方面就没有什么可改进的了。