【发布时间】:2020-06-04 20:31:08
【问题描述】:
我正在使用计算能力为 6.0 的 Tesla P100。 我想找到一个工具,它可以自动为我的内核代码提供最佳网格和块大小。
我最近发现了 CUDA 占用计算器(.xls 电子表格)。 但是当我下载的时候我发现它有点过时了,因为 Capability 直到 2.1。
我尝试搜索该电子表格的较新版本,以便计算更高的 C.C.,但没有任何显示。
所以我试图寻找替代方案,我发现从 CUDA 6.5 开始,引入了 Occupancy APIs。 这是电子表格的新替代品吗?
此外,我发现tool 来自 GitHub。 它是一个好工具吗?我可以考虑将其作为替代方案吗?还是使用前面提到的 Occupancy API 更好?
我也在问自己: CUDA 分析器(nvprof 或 Nsight)能否对占用率进行一些估计并给出一些最佳块/网格大小?
我对这些工具有点不熟练,所以如果我问一些琐碎的问题,我很抱歉。
【问题讨论】:
-
每个 CUDA 工具包中都提供了占用率计算器的更新版本。如果您安装了工具包,那么您就有了电子表格。查看CUDA安装目录下的tools