Tensorflow-gpu运行代码慢的问题排查
总结一次踩坑经历。
1. 查看代码是否运行在Tensorflow-gpu版本
检查是否同时安装了Tensorflow和Tensorflow-gpu两个版本,如果都安装了,卸载cpu版本的。
2. 查看GPU占用情况
一边运行代码,一边查看此时GPU的占用情况,可以反映出这个代码是否用了GPU加速。Ctrl+R进入命令窗口,在C:\Program Files\NVIDIA Corporation\NVSMI 路径下输入命令 nvidia-smi 查看GPU的占用情况。
这个图说明GPU占用了80%,说明代码正在使用GPU,也可以终止代码运行再查看一次。
此时占用为0,没有使用GPU。
3. 终极排查:检查代码
有时候代码运行速度慢的原因不是硬件的问题,而是软件的问题,本人在经过上述两个排查方法之后,依旧没有找到真正的原因。原来真正的原因在于代码,我用两个重复的代码块来增加一个简单的功能,而这个重复的代码块正是计算量最大的,这就导致了代码运行起来非常慢。把重复的代码块注释之后,速度就恢复正常了。
以上是我个人的一次踩坑经历,希望对你有一点点帮助