【发布时间】:2021-11-07 05:26:42
【问题描述】:
我一直在尝试使用 nvidia 网站中显示的 cpu 指标来测量 cuda 内核执行时间,但是我在使用 myCPUTimer() 函数时遇到了问题
T1=myCPUtimer();
vectorAdd<<<blocksPerGrid, threadsPerBlock>>>(d_A, d_B, d_C, numElements);
cudaDeviceSynchronize();
T2=myCPUTimer();
编译后我得到这个错误undefined reference to 'myCPUTimer' 而且我似乎在网上找不到任何有关如何使用此功能的文档。
【问题讨论】:
-
我想使用myCPUTImer()这个特定的函数,其他方法都很好。