【发布时间】:2018-11-17 09:13:47
【问题描述】:
假设我的设备有 2 个计算单元,我想在同一设备上同时运行两种不同的算法。是否可以通过创建 2 个不同的内核、2 个程序和 2 个命令队列来实现?
我尝试对此进行测试,但似乎第二个内核没有执行,所以我想知道这是否可能?
在 Nvidia OpenCL Programming Guide,我读到:
“对于计算能力 2.x 及更高版本的设备,多个内核可以在一个设备上同时执行,因此也可以通过使用流使足够多的内核同时执行来实现最大利用率。”
现在我不确定这是否真的意味着我可以运行多个不同的内核或仅运行同一内核的多个实例(这些只是简单的旧工作项)。
我还检查了我的 Nvidia GeForce GT 525M 的计算能力为 2.1。
【问题讨论】:
标签: concurrency opencl gpu nvidia