【发布时间】:2014-06-10 07:02:38
【问题描述】:
在许多在线资源中,可以找到“内存”、“带宽”、“延迟”绑定内核的不同用法。在我看来,作者有时会使用他们自己对这些术语的定义,我认为这对某人做出明确区分非常有益。
据我了解: 带宽绑定内核在访问全局内存方面接近设备的物理限制。例如。在 M2090 设备上,应用程序使用 177GB/s 中的 170GB/s。
延迟受限的内核是其主要的停顿原因是由于内存提取。所以我们并没有使全局内存总线饱和,但仍然需要等待数据进入内核。
计算绑定内核是计算在内核时间中占主导地位的内核,假设为内核提供内存没有问题,并且算术和延迟有很好的重叠。
如果我做对了,“内存绑定”内核会是什么?是否有歧义,如果有,我们是否应该将对话限制在上述三个术语上?
谢谢!
【问题讨论】:
-
是不是还有一种经常发生的情况:受pci-e传输率的限制?