【发布时间】:2017-04-17 16:47:47
【问题描述】:
我知道nvidia-smi -l 1 会每隔一秒提供一次 GPU 使用率(类似于以下内容)。但是,我希望能解释一下 Volatile GPU-Util 的真正含义。这是使用的 SM 数量超过总 SM 的数量,还是占用率,还是其他什么?
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 367.48 Driver Version: 367.48 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
|===============================+======================+======================|
| 0 Tesla K20c Off | 0000:03:00.0 Off | 0 |
| 30% 41C P0 53W / 225W | 0MiB / 4742MiB | 96% Default |
+-------------------------------+----------------------+----------------------+
| 1 Tesla K20c Off | 0000:43:00.0 Off | 0 |
| 36% 49C P0 95W / 225W | 4516MiB / 4742MiB | 63% Default |
+-------------------------------+----------------------+----------------------+
+-----------------------------------------------------------------------------+
| Processes: GPU Memory |
| GPU PID Type Process name Usage |
|=============================================================================|
| 1 5193 C python 4514MiB |
+-----------------------------------------------------------------------------+
【问题讨论】:
-
对于那些想知道的人,SM 表示 Streaming Multiprocessor,它的解释是 here.
-
Volatile来自顶行,如Volatile Uncorr. ECC- 这听起来像是一个严重的内存错误。上面的输出中有 0 个。