在上一个电脑是950m的显卡,在配置tensoflowgpu环境时,由于先安装了cpu版本,作为一个小白,一开始只是想在这个基础上进行修改,但血与泪的教训告诉我还是全部重装来的痛快。
比较开心的是家人给我换了个新电脑了,比较扎心的是环境又需要重新配置。为了保险起见一开始安装了cuda9.2版本的,那时候tensorflow_gpu 版本官方还没有公布,我屁颠屁颠的到github下载了针对cuda9.2 cudnn7.2版本的tensorflow_gpu 1.10版本。这篇博主大佬写的很详细,RTX2060+win10+Tensorflow GPU+CUDA 9.2+CUDNN7.2+python 3.65大家可以参考他的步骤但具体的版本还是需要根据自己的电脑进行安装.
扎心的是这个博主并没有牵扯到keras版本,我按照官网安装了keras的对应版本2.2.0,运行时总是报错,还有来自我的哭诉!RTX2060+CUDA10.0+cudnn7.6.5+python3.6+keras
numpy keras tensorflow一顿操作猛如虎之后,回来我还是一无所有。我开始逐个分析,发现没有keras的时候tensorflow_gpu会成功。本人推测是从GitHub轮子网站下载的原因,毕竟我的keras版本是与官方的tensorflow对应的。
经过我的多方查阅,发现官方已经有了相应的版本,不需要github下载了!好的!cuda10.我来啦!卸掉cuda9.2的一切,删除安装包,清除注册表。额,10.0始终安装不成功,RTX2060+CUDA10.0+cudnn7.6.5+python3.6+keras

我也不知道哪里没有卸载干净,绝招来了,RTX2060+CUDA10.0+cudnn7.6.5+python3.6+keras
DDU卸载!!!!这里一定要选择安全模式*,第一次没有选择安全模式,导致驱动出现错误,驱动精灵也没有解决问题,只好再次运行DDU卸载驱动重新安装,驱动有问题会导致GPU计算识别不了显卡!
运行时还会缺少cudart_100.dl ,nvcuda.dll,千万不要相信网上下载然后放到指定位置的言论,因为跟你的电脑驱动 以及cuda版本很可能不匹配,还是要搜索一下本机是否存在这个文件,存在这个文件的位置是否配置了环境变量!若本机不存在,那么很遗憾,你的cuda和显卡驱动没有安装成功。
其实本渣也可以用我的AMD Ryzen 7 4800H的cpu跑网络训练,一层两层还好,三层以上400 epoch得一下午时间了,我真的不甘让我的RTX2060轻轻松松不干活。经过两天两夜的折腾终于起飞!
RTX2060+CUDA10.0+cudnn7.6.5+python3.6+keras
RTX2060+CUDA10.0+cudnn7.6.5+python3.6+keras
其中发现问题的过程真的让人烦躁,但是解决问题的快感也无法取代。
遇到的问题:
1 keras训练报错 RTX2060+CUDA10.0+cudnn7.6.5+python3.6+keras
2 无法安装cuda10.0
3 无法动态加载cudart100.dll文件,nvcuda.dll文件
4 显卡驱动无法安装
5 tensorflow_gpu=1.15 与keras对应的版本2.2.5 numpy版本1.19.1(没有找到与tensorflow gpu 1.15对应的keras版本,我试错了两边发现2.2.5与其兼容。)
遇到以上问题的欢迎交流

相关文章: