【发布时间】:2014-11-20 11:03:02
【问题描述】:
由于我最近才开始学习 CUDA,银行冲突似乎是 CUDA 设备的限制之一,应该仔细考虑。但在阅读CUDA programming guide 中的计算能力 3.0 时,我发现
“对warp的共享内存请求不会在访问同一个64位字中的任何子字的两个线程之间产生bank冲突(即使两个子字的地址位于同一个bank中) : 在这种情况下,对于读取访问,64 位字被广播到请求线程,对于写入访问,每个子字仅由一个线程写入(哪个线程执行写入未定义)。"
这是否意味着我们可以忽略 CC 3.0 或更高版本中的 CUDA 应用程序的银行冲突?
【问题讨论】:
标签: cuda