【问题标题】:parallel opencl kernel execution并行opencl内核执行
【发布时间】:2019-01-16 04:58:49
【问题描述】:

我正在尝试并行执行多个内核。每个内核彼此独立。我正在尝试在 GPU 上执行内核。我认为是乱序执行并将每个内核分别排入队列。这是解决这个问题的方法还是有其他方法可以解决?

【问题讨论】:

  • 欢迎来到 SO!请avoid不惜一切代价使用文本数据的图像。请编辑您的问题,用适当格式的代码替换图像。
  • 嗨,谢谢你的建议。
  • OpenCL 可以在数据数组上运行相同的内核。当然,您可以并行运行多个内核并使用事件进行同步。你也可以制作具有 IF 条件的超级内核,它运行不同的子内核,但效率低下
  • 我知道我们可以并行执行多个内核,我只是想确认一下我认为无序执行内核并将每个内核单独排队是可行的方法,或者我可以这样做以任何其他方式?

标签: opencl open-closed-principle opencl-c


【解决方案1】:

有两种可能的解决方案:

  1. 创建一个乱序队列并将两个内核加入队列。

  2. 创建两个队列并将一个内核排入每个队列。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2015-01-30
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2019-03-28
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多