将 NVIDIA Visual Profiler 用于由包装函数调用的 CUDA 程序答案

【问题标题】：Using NVIDIA Visual Profiler for a CUDA program called by a wrapper function将 NVIDIA Visual Profiler 用于由包装函数调用的 CUDA 程序
【发布时间】：2012-02-22 21:13:39
【问题描述】：

我将一个程序从 IDL 转换为 CUDA，它在 256X256Xn 的密度立方体上执行一些计算并渲染二维图像。程序正常工作，但所有的预处理仍然在 IDL 中完成（例如读入密度立方体等）并将该信息传递给包装函数（使用 call_external 到 C 程序），然后调用 CUDA。

目前我正在尝试优化程序并想使用 NVIDIA Visual Profiler 来检查我的合并，并且想知道是否有办法做到这一点...一种让视觉分析器在我们调用时运行的方法程序的 CUDA 部分？

我目前无法测试任何东西，因为有太多变量可以硬编码到 CUDA 函数中，但是如果没有从 IDL 到 C 到 CUDA 的这些值，它就无法运行。

我确实设置了它，所以我可以运行 IDL，让它停止，然后手动调用 C 包装函数，而不是只运行 IDL 并让它自动执行所有操作。

谢谢

【问题讨论】：

您是否尝试过通过可视化分析器运行 IDL 程序？我已经用 python + pyCUDA 完成了这项工作——运行了几层 python，然后启动了内核——并且分析器成功地分析了内核。

标签： optimization cuda nvidia

【解决方案1】：

您可以从 Visual Profiler 启动应用程序。无论如何，它只会分析 CUDA 调用。或者，您可以使用开始和停止分析按钮来控制何时开始和结束分析。这很简单，但普遍适用。

【讨论】：

我无法让它工作，但我会继续记住这一点。