【发布时间】:2017-09-14 17:13:25
【问题描述】:
我正在使用 GEFORCE GTX 1080 ti (11GB) 的 tf-seq2seq 包训练 NMT 模型。在训练模型期间,执行nvidia-smi 表明,在所有 CPU 内核都处于忙碌状态时,GPU volatile 利用率始终低于 25%。为什么?
如果我充分利用了 GPU 的所有潜力,我该如何发现?
【问题讨论】:
标签: tensorflow gpgpu
我正在使用 GEFORCE GTX 1080 ti (11GB) 的 tf-seq2seq 包训练 NMT 模型。在训练模型期间,执行nvidia-smi 表明,在所有 CPU 内核都处于忙碌状态时,GPU volatile 利用率始终低于 25%。为什么?
如果我充分利用了 GPU 的所有潜力,我该如何发现?
【问题讨论】:
标签: tensorflow gpgpu
上述实验中的模型太小,无法充分利用 GPU 的所有潜力。
在上述实验中扩大模型(利用更多层、增加使用的词汇量、增加序列长度……)导致更好的利用率(低于 80-90%)。
【讨论】: