【发布时间】:2013-03-17 13:40:54
【问题描述】:
想知道有没有办法优化matlab函数gather。我正在开发一个具有非常大矩阵的 Cuda 代码,并且我注意到我必须用来取回我的 GPU 数据的 gather 函数非常慢。对于一个 2^13x2^8 的矩阵,大约需要 3 秒!
【问题讨论】:
-
@MariusBrendmoe, gather 是 matlab 中将 gpuArray 类型从设备内存移回主机内存的函数。 matlab GPU 代码中不一定有任何用户定义的内核。
-
您好,我使用的是 GTX 680 卡。我的矩阵包含单个(cuda 中的浮点数)值。