【问题标题】:Is there a relation between single and double precision in NVIDIA Tesla?NVIDIA Tesla 中的单精度和双精度之间是否存在关系?
【发布时间】:2014-09-03 20:41:28
【问题描述】:

Tesla K20 型号单精度浮点性能峰值约为 3.52 TFlops,但双精度为 1.17 TFlops,因此比率为 3。Tesla K20X 有 3.95 和 1.31,Tesla K40 有 4.29 和 1.43 TFlops,比例似乎在重复。我的问题是比率为 3 而不是 2 是否有原因,这对我来说似乎是合乎逻辑的,因为单精度和双精度之间的差异。我正在学习GPUS和GPGPUS,所以不太了解。

在此 pdf 的第二页中有一个规格表。 NVIDIA-Tesla-Kepler-Family-Datasheet.pdf

【问题讨论】:

    标签: gpu nvidia tesla


    【解决方案1】:

    您列出的模型均基于 Kepler 架构,其峰值双精度率等于峰值单精度率的 1/3。这就是 NVIDIA 构建此硬件的方式。相比之下,上一代硬件 Fermi 的峰值双精度和单精度比率为 1/2。

    关于指令吞吐量,您可以参考 NVIDIA 文档,按指令类型和硬件生成:

    http://docs.nvidia.com/cuda/cuda-c-programming-guide/index.html#maximize-instruction-throughput

    您会注意到消费级产品 (GeForce GTX) 通常具有低得多的双精度率 - 1/8、1/12、1/24 甚至 1/32,具体取决于硬件版本。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2018-02-23
      • 1970-01-01
      • 2016-08-17
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2014-05-28
      • 1970-01-01
      相关资源
      最近更新 更多