【发布时间】:2014-05-27 04:40:28
【问题描述】:
我搜索了一下,但我发现的所有东西都只能在 CPU 代码中进行注释,我如何测量内核内部在 1 个线程块的 2 个 _syncthread() 之间的部分时间?可能吗?
【问题讨论】:
我搜索了一下,但我发现的所有东西都只能在 CPU 代码中进行注释,我如何测量内核内部在 1 个线程块的 2 个 _syncthread() 之间的部分时间?可能吗?
【问题讨论】:
一种方法是使用clock() 或clock64 函数,如in the programming guide 所述。
在 clock64 上搜索 cuda 标签以获取其用法的更多示例。
【讨论】: