【发布时间】:2021-05-06 18:04:57
【问题描述】:
CUDA Profiling Guide 列出了各种 reasons 用于采样的经线停顿,例如分配、屏障、LG Throttle 等。并且 - NSight Compute 分析器将这些分布显示为分析结果的一部分。
问题是,一些停顿原因被列为仅从某些计算能力开始支持,例如“LG 油门:7.0+”
我的问题:当停顿原因是这种“不受支持”的原因时,具有较早计算能力的设备会发生什么?或者,换句话说,列出的每个停顿原因的后备是什么?
在 Ye Olde NVIDIA Visual Profiler 中,我们有一个“其他”停滞原因,请参阅:
What are "Other" Issue Stall Reasons displayed by the Nsight profiler?
但我在(我的版本)NSight Compute 中没有看到这一点。
【问题讨论】:
标签: cuda profiling nsight-compute