【发布时间】:2018-01-14 14:58:03
【问题描述】:
我是 Ubuntu 和 GPU 的新手,最近在我们的实验室中使用了一台配备 Ubuntu 16.04 和 4 个 NVIDIA 1080ti GPU 的新 PC。该机还配备了 i7 16 核处理器。
我有一些基本问题:
为 GPU 安装了 Tensorflow。那么我想,它会自动优先考虑 GPU 的使用吗?如果是这样,它是同时使用所有 4 个,还是使用 1 个然后在需要时招募另一个?
我可以在模型训练期间实时监控 GPU 使用/活动吗?
我完全理解这是基本的硬件问题,但对这些具体问题给出明确的明确答案会很棒。
编辑:
根据这个输出 - 这真的是说我的每个 GPU 上的几乎所有内存都在使用吗?
【问题讨论】:
-
对于 2:在单独的终端窗口中尝试
nvidia-smi。 -
watch -n0.1 nvidia-smi每使用 0.1 秒 -
非常感谢 - 请参阅编辑
-
另外,根据我的 tensorflow 经验,我的默认设置会抓取所有 GPU 上的所有内存。为了避免这种情况,我将会话配置的选项
gpu_options.allow_growth设置为True。另见stackoverflow.com/questions/34199233。 -
nvidia-smi -l也可以解决问题
标签: performance tensorflow gpu