【发布时间】:2013-06-20 11:23:24
【问题描述】:
我打算为机器学习算法编写一个 cuda 内核,但我尝试比较从设备代码获得的效率和从主机到设备传输数据的时间损失。有什么工具可以帮助我,或者有什么准确的方法可以进行这种比较以得出 cuda 实现是否值得编码?
【问题讨论】:
标签: cuda data-transfer date-arithmetic
我打算为机器学习算法编写一个 cuda 内核,但我尝试比较从设备代码获得的效率和从主机到设备传输数据的时间损失。有什么工具可以帮助我,或者有什么准确的方法可以进行这种比较以得出 cuda 实现是否值得编码?
【问题讨论】:
标签: cuda data-transfer date-arithmetic
使用 CUDA 分析器。它绘制了漂亮的图表,代表您的程序及时执行的操作。这将显示传输时间和内核运行时间。一般来说,如果您的算法与数据大小相比进行大量计算,您会看到显着的提升。
【讨论】: