【发布时间】:2014-05-21 17:20:18
【问题描述】:
我在 .cu 文件中编写了一个简单的 cuda 程序。当我想看看这个程序的性能时。我选择“Nsight->Start Performance Analysis....”然后选择“Profile CUDA Application”。启动应用程序一段时间并完成捕获后,报告说“没有内核启动捕获”摘要报告说“遇到 1 个错误”。有人可以帮我弄清楚为什么会这样吗?
【问题讨论】:
我在 .cu 文件中编写了一个简单的 cuda 程序。当我想看看这个程序的性能时。我选择“Nsight->Start Performance Analysis....”然后选择“Profile CUDA Application”。启动应用程序一段时间并完成捕获后,报告说“没有内核启动捕获”摘要报告说“遇到 1 个错误”。有人可以帮我弄清楚为什么会这样吗?
【问题讨论】:
在您的示例中完成所有 CUDA 工作后,您是否致电 cudaDeviceSynchronize() 或 cudaDeviceReset()?否则 Nsight 不能保证所有的启动和 memcpy 记录缓冲区都被刷新。
【讨论】: