【问题标题】:OpenCL scan codeOpenCL扫码
【发布时间】:2015-12-01 06:50:23
【问题描述】:

我正在寻找 OpenCL 中 scan(prefixsum) 的快速实现。我发现最好的东西是在 Nvidia SDK 中,但它很旧(2010 年)。 有谁知道 OpenCL 中 Scan 的任何其他实现?

【问题讨论】:

    标签: opencl nvidia prefix-sum


    【解决方案1】:

    【讨论】:

    • 内置操作仅限于一个工作组(几十个线程)
    【解决方案2】:

    OpenCL 中有几种扫描操作的开源实现:

    • CLOGS,一个用于在 OpenCL C++ API 之上进行高级操作的库。
    • Boost.Compute,一个用于 OpenCL 的 C++ GPU 计算库。
    • VexCL,用于 OpenCL/CUDA 的 C++ 向量表达式模板库。
    • Bolt,为 GPU 优化的 C++ 模板库。

    CLOGS 的作者写了一篇paper 比较这些实现中扫描(和排序)操作的性能。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2012-09-08
      • 1970-01-01
      • 1970-01-01
      • 2011-11-11
      • 2014-09-19
      • 2010-11-27
      相关资源
      最近更新 更多