【发布时间】:2011-05-19 15:30:15
【问题描述】:
我有一个 cuda 代码,我已经在其中实现了几个 C2C 2D FFT。它们都使用相同的计划,但由于某种原因,2D FFT 的时间很大,而且似乎变化很大。相同数据大小的 FFT 似乎需要 0.4s 到 1.8s
这是针对 1920x1080 FFT 的。这些时间看起来合理吗?
无论如何 - 我在 CUDA 1-D 批量 FFT 的速度方面有很好的经验。在行上进行 1D FFT 是否相同,然后再在矩阵的列上进行以给出与此 2D FFT 相同的结果?我之前在较大的一维 FFT 数据集上经历过在百分之几秒内发生 FFT,因此我希望能够修复其中的一些结果。
谢谢
【问题讨论】:
-
请记住,这里还有一个隐含的转换,其访问模式可能会大大减慢速度。
-
这些时间非常长 - 2.67 GHz Core i7 上的 FFTW 将在