【问题标题】:How to include timing for host functions in NVIDIA's visual profiler?如何在 NVIDIA 的视觉分析器中包含主机功能的计时?
【发布时间】:2013-05-17 21:00:20
【问题描述】:

我有一个程序,我尝试在其中将主机功能与 GPU 内核重叠。为了检查主机功能与 GPU 内核的重叠程度,我使用了 NVIDIA 的视觉分析器。但是,分析器没有显示我的主机功能的任何计时结果。相反,它只显示 CUDA 内核的 CPU 时间。

有没有办法将宿主函数的计时结果整合到可视化分析器的时间线中?

【问题讨论】:

    标签: cuda


    【解决方案1】:

    是的,这是可能的。查看 NVIDIA 工具扩展 API,该 API 记录在 profiler manual 中。

    您可能希望在要检查重叠的主机代码部分周围mark a range

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2011-05-20
      • 2016-06-22
      • 1970-01-01
      • 2021-06-27
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多