【发布时间】:2014-02-03 08:23:51
【问题描述】:
与内存事务的 NVIDIA GPU 性能计数器相关的子分区、扇区和 DRAM 单元是什么?
我正在寻找有关如何解释以下性能计数器的信息:
fb_subp0_read_sectors : 发送到子分区的读取请求数 所有 DRAM 单元中的 0 个 fb_subp1_read_sectors :读取次数 发送到所有 DRAM 单元的子分区 1 的请求 fb_subp0_write_sectors :发送到的写请求数 所有 DRAM 单元的子分区 0 fb_subp1_write_sectors : Number 发送到所有 DRAM 单元的子分区 1 的读取请求数 fb0_subp0_read_sectors :发送到的读取请求数 DRAM 单元 0 的子分区 0 fb0_subp1_read_sectors :数量 发送到 DRAM 单元 0 的子分区 1 的读取请求 fb0_subp0_write_sectors :发送到的写请求数 DRAM 单元 0 的子分区 0 fb0_subp1_write_sectors :数量 写请求发送到 DRAM 单元 0 的子分区 1 fb1_subp0_read_sectors :发送到的读取请求数 DRAM 单元 1 的子分区 0 fb1_subp1_read_sectors :数量 发送到 DRAM 单元 1 的子分区 1 的读取请求 fb1_subp0_write_sectors :发送到的写请求数 DRAM 单元 1 fb1_subp1_write_sectors 的子分区 0:编号 发送到 DRAM 单元 1 的子分区 1 的写入请求数
我查看了 NVIDIA Visual Profiler 5.0 的文档,但没有找到任何其他信息。
【问题讨论】:
-
我还没有找到关于你提到的性能计数器的任何具体信息。我认为他们提到的问题是Optimizing Matrix Transpose in CUDA 和论文中讨论的分区露营问题:Bounding the Effect of Partition Camping in GPU Kernels,但我相信你已经知道了。