【发布时间】:2017-05-10 08:06:48
【问题描述】:
我正在使用 NVIDIA Tesla P40 来训练分类模型。我用tensorflow的bidirectional_dynamic_rnn搭建了bi-lstm网络,训练效率太差,只占用了30%左右的计算资源,速度甚至不比使用45个逻辑核的CPU快。能否帮忙给点建议,充分利用GPU计算资源,或者说明原因????
【问题讨论】:
标签: tensorflow gpu
我正在使用 NVIDIA Tesla P40 来训练分类模型。我用tensorflow的bidirectional_dynamic_rnn搭建了bi-lstm网络,训练效率太差,只占用了30%左右的计算资源,速度甚至不比使用45个逻辑核的CPU快。能否帮忙给点建议,充分利用GPU计算资源,或者说明原因????
【问题讨论】:
标签: tensorflow gpu
第一个提示:尝试增加batch_size。它将增加并行使用的数据量,从而减少 I/O 时间。
请注意,它将需要更多 GPU 内存,因此您必须对其进行调整以避免内存不足错误。
【讨论】: