【发布时间】:2017-02-16 18:38:32
【问题描述】:
虽然我已经编写 CUDA 内核一段时间了,但我还没有使用动态并行 (DP)。我遇到了一项我认为可能适合的任务;但是,我希望能够使用 DP 的方式是:
如果块发现它需要更多线程来完成它的工作,它会产生它们;它将“它所知道的”传递给它的衍生线程——本质上,它的共享内存的内容,每个衍生线程块都会在自己的共享内存中获得一份副本;线程使用其父线程“知道”的内容来确定他们需要继续做什么,然后去做。
AFAICT,但是,这种共享内存的“继承”不会发生。全局内存(以及通过内核参数的常量内存)是“父”DP 内核块向其“子”块传递信息的唯一方式吗?
【问题讨论】:
-
一言以蔽之。
-
@talonmies:(低头)回答这个问题,所以我可以接受:-(
标签: cuda dynamic-parallelism gpu-shared-memory