【问题标题】:Using NVIDIA Visual Profiler for a CUDA program called by a wrapper function将 NVIDIA Visual Profiler 用于由包装函数调用的 CUDA 程序
【发布时间】:2012-02-22 21:13:39
【问题描述】:

我将一个程序从 IDL 转换为 CUDA,它在 256X256Xn 的密度立方体上执行一些计算并渲染二维图像。程序正常工作,但所有的预处理仍然在 IDL 中完成(例如读入密度立方体等)并将该信息传递给包装函数(使用 call_external 到 C 程序),然后调用 CUDA。

目前我正在尝试优化程序并想使用 NVIDIA Visual Profiler 来检查我的合并,并且想知道是否有办法做到这一点...一种让视觉分析器在我们调用时运行的方法程序的 CUDA 部分?

我目前无法测试任何东西,因为有太多变量可以硬编码到 CUDA 函数中,但是如果没有从 IDL 到 C 到 CUDA 的这些值,它就无法运行。

我确实设置了它,所以我可以运行 IDL,让它停止,然后手动调用 C 包装函数,而不是只运行 IDL 并让它自动执行所有操作。

谢谢

【问题讨论】:

  • 您是否尝试过通过可视化分析器运行 IDL 程序?我已经用 python + pyCUDA 完成了这项工作——运行了几层 python,然后启动了内核——并且分析器成功地分析了内核。

标签: optimization cuda nvidia


【解决方案1】:

您可以从 Visual Profiler 启动应用程序。无论如何,它只会分析 CUDA 调用。或者,您可以使用开始和停止分析按钮来控制何时开始和结束分析。这很简单,但普遍适用。

【讨论】:

  • 我无法让它工作,但我会继续记住这一点。
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 2016-06-23
  • 1970-01-01
  • 1970-01-01
  • 2013-08-06
  • 2016-08-30
  • 2015-05-03
  • 1970-01-01
相关资源
最近更新 更多