【发布时间】:2015-06-30 02:49:10
【问题描述】:
我想将我以前的 c++ 代码转换为 CUDA
for(int x=0 ; x < 100; x++)
{
for(int y=0 ; y < 100; y++)
{
for(int w=0 ; w < 100; w++)
{
for(int z=0 ; z < 100; z++)
{
........
}
}
}
}
这些循环组合成一个新的 int 值。
如果我想使用 CUDA,我必须在构建之前设计线程层次结构 内核代码。
那么我该如何设计层次结构呢?
取决于每个循环,我认为它会是这样的:
100*100*100*100 = 100000000 个线程。
你能帮我吗
谢谢
我的 CUDA 规范:
CUDA 设备 #0
主要修订号:1
次要修订号:1
名称:GeForce G 105M
全局内存总量:536870912
每个块的总共享内存:16384
每个块的寄存器总数:8192
经纱尺寸:32
最大内存间距:2147483647
每个块的最大线程数:512
块的最大维度1:512
块的最大维度2:512
块的最大维度 3:64
网格最大维度1:65535
网格最大维度2:65535
网格的最大维度 3:1
时钟频率:1600000
总常量内存:65536
纹理对齐:256
并发复制和执行:否
多处理器数量:1
内核执行超时:是
【问题讨论】:
标签: cuda