【问题标题】:What does NSight Compute show for a stall reason that isn't "supported"?NSight Compute 出于不受“支持”的停顿原因显示什么?
【发布时间】:2021-05-06 18:04:57
【问题描述】:

CUDA Profiling Guide 列出了各种 reasons 用于采样的经线停顿,例如分配、屏障、LG Throttle 等。并且 - NSight Compute 分析器将这些分布显示为分析结果的一部分。

问题是,一些停顿原因被列为仅从某些计算能力开始支持,例如“LG 油门:7.0+”

我的问题:当停顿原因是这种“不受支持”的原因时,具有较早计算能力的设备会发生什么?或者,换句话说,列出的每个停顿原因的后备是什么?

在 Ye Olde NVIDIA Visual Profiler 中,我们有一个“其他”停滞原因,请参阅:

What are "Other" Issue Stall Reasons displayed by the Nsight profiler?

但我在(我的版本)NSight Compute 中没有看到这一点。

【问题讨论】:

    标签: cuda profiling nsight-compute


    【解决方案1】:

    Nsight Compute 是not supported and not the recommended profiler for GPUs with a compute capability prior to 7.0

    在不受支持的设置中,该工具的行为没有正式定义。认为它是 UB。

    对具有 cc7.0 之前计算能力的 GPU 使用旧版分析器(nvvp、nvprof)。

    【讨论】:

    • Nsight Compute 2019.5 可用于 Pascal GPU,GP100 除外。
    • @AbatorAbetor:等等,如果这是真的,那么对于 7.0 之前的 GPU 和 7.0 停滞的原因,Nsight Compute 会显示什么?
    【解决方案2】:

    在 Pascal GPU (sm_61) 上使用 Nsight Compute 2019.5 分析内核,需要 7.0+ 的指标 LG ThrottleSleeping 不会显示为停滞原因。

    【讨论】:

    • 我想知道他们是否显示为“Stall Wait”...
    猜你喜欢
    • 1970-01-01
    • 2021-12-04
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多