【问题标题】:Which cards and compute capabilities are required to fully utilize CUDA 5's features [closed]充分利用 CUDA 5 的功能需要哪些卡和计算能力 [关闭]
【发布时间】:2012-10-19 06:44:29
【问题描述】:

我们刚刚收到了稳定版的 CUDA 5。有一些新的术语,比如 Kepler 和使用性能更好的 MPI 的能力,以及同时运行同一张卡和 32 个应用程序的能力。我有点困惑,正在寻找这些问题的答案:

  • 需要哪些卡和计算能力才能充分利用 CUDA 5 的功能?
  • 新功能是否仅适用于 Kepler 架构,例如 GPUDirect、Dynamic Parallelism、Hyper Q 和 Dynamic Parallelism。
  • 如果我们有 Fermi 架构,那么使用 CUDA 5 的好处是什么?除了在 Linux 和 Eclipse 上使用 NSight 的能力之外,它是否带来了其他好处。我认为最重要的功能是构建库的能力?
  • 从 CUDA 4 升级到 CUDA 5,您是否看到任何性能改进?(我在 Linux 机器上得到了一些加速)

我发现了一些文件,比如

然而,更好、更简短的描述可能会让我们的头脑更清晰。

PS:请不要将答案局限于上述问题。我可能会遗漏一些类似的问题。

【问题讨论】:

    标签: sdk cuda language-features computer-architecture


    【解决方案1】:

    动态并行需要计算能力 3.5(例如 GK110),因为早期的 GPU 没有线程启动内核或直接将其他 API 调用注入硬件命令队列所需的硬件。

    Hyper-Q 需要计算能力 3.5。

    SHFL 内部函数需要 CC 3.0 (GK104)

    CUDA 5 中的设备代码链接、NSight EE、nvprof、性能改进和错误修复使 Fermi 和早期 GPU 受益。

    【讨论】:

    • GK110全球发布了吗?哪些卡带有这个代号?
    • @ahmad:硬件尚未公开。
    • Tesla 产品系列中将使用 GK110 的产品之一是the K20
    猜你喜欢
    • 2015-05-10
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多