对 GPU 内存带宽的概念理解答案

【问题标题】：Conceptual understanding of a Memory Bandwidth of a GPU对 GPU 内存带宽的概念理解
【发布时间】：2012-08-23 23:50:55
【问题描述】：

我对 GPU 的内存带宽的概念有点困惑。

根据它所说的 TESLA M 2090 GPU 规格峰值带宽为 177.6 GB/s。

所以当人们提到带宽时，它是指

无论我在哪里读到这个词，我都没有看到这个澄清

【问题讨论】：

您还可以区分连续的数据流（在任一方向；通常称为带宽）和往返通信的实例（查找，通常称为延迟）。对于 NVIDIA GPU，全局内存延迟通常约为 400 个周期（对于 L1 和 L2 未命中）。

标签： cuda

【解决方案1】：

总线上只有一组导线，因此不能同时写入或读取数据。理论上带宽是一样的，总读+写==总读==总写。

但实际上，如果您将大量连续数据块写入设备，传输效率会更高，这是最常见的用法，也是系统优化的目标。

编辑。显卡的内部内存带宽（即卡上各种组件之间的内存路径）远高于进出计算机的带宽。

它也复杂得多，不同类型的内存以不同的方式连接到不同的处理器，制造商会选择听起来最高的数字 - 这个数字真的没有意义，除了比较非常相似的卡的不同型号来自同一个 GPU 系列。

【讨论】：

【解决方案2】：

带宽是在给定时间段内可以或读取的数据量。

同一总线用于读取和写入。在给定的时钟周期内，总线可用于读取或写入。

【讨论】：