【发布时间】:2013-04-19 07:25:23
【问题描述】:
我似乎遇到了可以在计算引擎队列中排队的异步内核启动数量的限制。在此限制之后,主机被阻塞,GPU-CPU 并发丢失。这在 CUDA 编程指南中没有提到。
- 可以在计算引擎队列中排队的异步内核启动的最大数量是多少?
- 这个最大数量是否在某种程度上取决于正在启动的内核?
- CPU 将内核启动放入计算引擎队列所需的时间是否取决于正在启动的内核?
- 可以在复制引擎队列中排队的异步 memcpy 的最大数量是多少?
【问题讨论】:
标签: cuda