【发布时间】:2013-02-28 11:49:59
【问题描述】:
假设我们有 16 个线程在块 1 上运行,另外 16 个线程在块 2 上运行。
每个线程从内存中读取 1 个 double:块 1 上的 16 个线程需要从内存地址 0-127 读取 16 个 double,块 2 上的 16 个线程需要从地址 128-255 读取。
我知道块 1 上 16 个线程的内存读取可以在一个内存事务中完成,因为合并访问。
我的问题是,当我们考虑这两个区块时,我们需要多少内存事务,一个还是两个?换句话说,不同块的内存访问可以同时发生吗?
【问题讨论】:
标签: cuda