【发布时间】:2011-04-12 19:22:02
【问题描述】:
我有一个 CUDA 项目。它由几个包含我的应用程序逻辑的 .cpp 文件和一个包含多个内核的 .cu 文件以及一个调用它们的 __host__ 函数组成。
现在我想确定我的内核使用的寄存器数量。我的正常编译器调用如下所示:
nvcc -arch compute_20 -link src/kernel.cu obj/..obj obj/..obj .. -o bin/..exe -l glew32 ...
不幸的是,在此调用中添加“-Xptxas –v”编译器标志没有任何效果。编译器仍然产生与以前相同的文本输出。编译后的 .exe 也与以前一样工作,但有一个例外:我的帧率从 80fps 跃升至 1800fps。
【问题讨论】: