【发布时间】:2013-06-11 01:08:18
【问题描述】:
如果一个线程正在访问全局内存,为什么它要访问一个大块?这个大块存储在哪里?
如果您以合并的方式从全局内存中读取,将全局内存的公共块复制到共享内存中是否有益,或者不会有任何改进。
ie:如果每个线程正在读取接下来的 5 个或 10 个或 100 个内存位置,并将它们取平均值,如果您可以将全局内存中的一大块 X 点放入共享内存中,您是否可以不写一个 if 语句说如果您寻找这些内存值之一,从共享内存而不是全局读取?我假设翘曲发散惩罚会小于每次从全局内存中读取。
【问题讨论】:
标签: cuda