【问题标题】:What's the difference between "gld/st_throughput" and "dram_read/write_throughput" metrics?“gld/st_throughput”和“dram_read/write_throughput”指标有什么区别?
【发布时间】:2012-12-12 12:57:18
【问题描述】:

在 CUDA 视觉分析器版本 5 中,我知道“gld/st_requested_throughput”是应用程序请求的内存吞吐量。然而,当我试图找到硬件的实际吞吐量时,我很困惑,因为有两对指标似乎是合格的,它们是“gld/st_throughput”和“dram_read/write_throughput”。哪一对实际上是硬件吞吐量?另一个是做什么的?

【问题讨论】:

    标签: memory cuda metrics throughput


    【解决方案1】:

    gld/st_throughput 包括由 L1 和 L2 缓存服务的事务。而dram_read/write_throughput 是 L2 和设备内存之间的吞吐量。因此,每个全局内存访问都计入 gld/st_throughput,但只有错过 L1 和 L2 缓存的请求才计入 dram_read/write_throughput

    我在任何地方都没有找到关于计数器的良好概览。希望 NVIDIA 能提供这些……

    【讨论】:

    • 有一个指标参考here。不是试图开始讨论它是否好,我相信它会更好。
    • 恕我直言,没有直接从全局内存提供事务。所有对全局内存的访问都经过 L2,包括与 CPU 主机之间的副本。 Found at.
    • @stuhlo:谢谢。我的回答在这一点上措辞不佳。会修复的。
    • @Roger Dahl@stuhlo:谢谢两位,我知道了!
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2018-12-15
    • 1970-01-01
    • 1970-01-01
    • 2021-04-02
    • 1970-01-01
    • 2016-04-09
    相关资源
    最近更新 更多