【发布时间】:2012-02-22 21:13:39
【问题描述】:
我将一个程序从 IDL 转换为 CUDA,它在 256X256Xn 的密度立方体上执行一些计算并渲染二维图像。程序正常工作,但所有的预处理仍然在 IDL 中完成(例如读入密度立方体等)并将该信息传递给包装函数(使用 call_external 到 C 程序),然后调用 CUDA。
目前我正在尝试优化程序并想使用 NVIDIA Visual Profiler 来检查我的合并,并且想知道是否有办法做到这一点...一种让视觉分析器在我们调用时运行的方法程序的 CUDA 部分?
我目前无法测试任何东西,因为有太多变量可以硬编码到 CUDA 函数中,但是如果没有从 IDL 到 C 到 CUDA 的这些值,它就无法运行。
我确实设置了它,所以我可以运行 IDL,让它停止,然后手动调用 C 包装函数,而不是只运行 IDL 并让它自动执行所有操作。
谢谢
【问题讨论】:
-
您是否尝试过通过可视化分析器运行 IDL 程序?我已经用 python + pyCUDA 完成了这项工作——运行了几层 python,然后启动了内核——并且分析器成功地分析了内核。
标签: optimization cuda nvidia