【问题标题】:Conceptual understanding of a Memory Bandwidth of a GPU对 GPU 内存带宽的概念理解
【发布时间】:2012-08-23 23:50:55
【问题描述】:

我对 GPU 的内存带宽的概念有点困惑。

根据它所说的 TESLA M 2090 GPU 规格 峰值带宽为 177.6 GB/s。

所以当人们提到带宽时,它是指

  • 单向流量的速度,例如每秒可以读取的字节数, 从设备

  • 双向流量的速度,例如每秒可以读取写入设备内存的字节数。

无论我在哪里读到这个词,我都没有看到这个澄清

【问题讨论】:

  • 您还可以区分连续的数据流(在任一方向;通常称为带宽)和往返通信的实例(查找,通常称为延迟)。对于 NVIDIA GPU,全局内存延迟通常约为 400 个周期(对于 L1 和 L2 未命中)。

标签: cuda


【解决方案1】:

总线上只有一组导线,因此不能同时写入或读取数据。理论上带宽是一样的,总读+写==总读==总写。

但实际上,如果您将大量连续数据块写入设备,传输效率会更高,这是最常见的用法,也是系统优化的目标。

编辑。显卡的内部内存带宽(即卡上各种组件之间的内存路径)远高于进出计算机的带宽。

它也复杂得多,不同类型的内存以不同的方式连接到不同的处理器,制造商会选择听起来最高的数字 - 这个数字真的没有意义,除了比较非常相似的卡的不同型号来自同一个 GPU 系列。

【讨论】:

    【解决方案2】:

    带宽是在给定时间段内可以读取的数据量。

    同一总线用于读取和写入。在给定的时钟周期内,总线可用于读取或写入。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2020-01-08
      • 1970-01-01
      • 2020-03-23
      • 1970-01-01
      • 2016-10-09
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多