【发布时间】:2021-04-12 20:05:45
【问题描述】:
现在我有一个16K*16K的大矩阵,全局内存不够用,怎么计算矩阵的二维FFT?
【问题讨论】:
-
很可能你不能。有核外fft算法。我不知道有任何 GPU 实现。当然没有袖口
-
您应该能够在 3GB GPU(使用 CUFFT)上执行该大小的
floatR2C 或 C2R 就地转换。 Here 是框架。我可以在 2GB GPU 上进行 15Kx15K 的转换。