CUDA：固定大小的数组存储在哪个内存空间中？答案

【问题标题】：CUDA: In which memory space is a fixed size array stored?CUDA：固定大小的数组存储在哪个内存空间中？
【发布时间】：2012-06-12 17:23:36
【问题描述】：

在内核中设置固定大小的数组时，如：

int my_array[100];

数组在哪个内存空间结束？

特别是，我想知道这样的数组是否可以存储在 >= 2.0 设备上的寄存器文件或共享内存中，如果可以，要求是什么。

【问题讨论】：

标签： arrays cuda

【解决方案1】：

对于 Fermi（可能还有更早的架构），要将数组存储在寄存器文件中，必须满足以下条件：

(1) 的原因是寄存器索引直接在 SASS 指令中编码。没有办法间接寻址寄存器。

限制(2)的寄存器数量的主要因素有：

(1) 的潜在解决方法是循环展开。如果循环使用循环计数器作为数组的索引，则展开循环（使用#pragma unroll 或手动）会使数组索引变为常量，因为现在每个数组访问都有单独的 SASS 指令。

部分基于此 NVIDIA 演示文稿：Local Memory and Register Spilling。该文档还详细介绍了变量和数组的位置如何影响性能。

【讨论】：

【解决方案2】：

内核中的本地数组，正如您定义的那样，分配在寄存器中，当没有足够的寄存器时分配在本地内存中。

如果你想在共享内存中分配数组，你必须指定它如下：

__shared__ int my_array[100];

【讨论】：