记录使用Nsight Compute 分析CUDA程序性能的步骤。

1.单击菜单栏上的Connet,弹出如下界面,设置要剖析的执行程序路径等运行相关参数;选择Interactive Profile模式,可以对剖析流程进行控制;所有参数设置完成后,单击Launch开始性能分析。Nsight Compute 使用
Nsight Compute 使用
2.在API Stream页面控制剖析软件执行到目标核函数,然后单击菜单栏的 Profile Kernel对核函数进行剖析
Nsight Compute 使用
Nsight Compute 使用
3.生成性能分析结果,在结果页面可以通过切换Page选项查看重点关注的参数,如Source ,Detail等
Nsight Compute 使用
Detail信息:展示核函数整体执行的一些性能指标
Nsight Compute 使用
Source信息:展示源码中每行代码及汇编指令执行使用资源情况
Nsight Compute 使用

相关文章:

  • 2021-08-17
  • 2022-12-23
  • 2022-12-23
  • 2022-12-23
  • 2021-07-25
  • 2021-09-04
猜你喜欢
  • 2022-12-23
  • 2021-04-01
  • 2021-11-29
  • 2021-11-07
  • 2021-05-22
  • 2022-12-23
相关资源
相似解决方案