由于搞deep learning的需要,在Ubuntu系统下安装cuda成为刚需。
当前的tensorflow,pytorch等框架需要cuda的较新版本,所以安装方法有可能需要不断踩坑改进。这篇blog记录一下最新的成功经验。
现在才开始记录,之前没有记录,主要原因是,之前安装有点太顺利了。先前,Ubuntu连上中国科大的源(mirrors.ustc.edu.cn),可以自动检索可更新的驱动,就可以安装成功。但是目前这种方法不管用了,不知道之后中国科大的源会不会再更新,不过最好还是脱离那个来安装比较好。比较方便follow不断更新的新版本。
先记录一下NVIDIA驱动的安装:
1. 在官网下载正确版本的驱动(中文官网下载速度快一些,注意版本,版本错了有可能会造成图形界面的循环登陆问题)。给予权限,sudo chmod +x ./NVIDIA_driver_name.run,至此安装文件已经准备好。
2. 禁用nouveau。具体操作是:编辑文件sudo gedit /etc/modprobe.d/blacklist-nouveau.conf,添加两行:
blacklist nouveau
options nouveau modeset=0
然后保存。之后需要重新生成 kernel initramfs:
sudo update-initramfs -u
然后重启
3. 重启之后,正常情况是图形界面进不去了,开机之后应该是进入ctrl+alt+F1。先运行:
sudo service lightdm stop
然后就可以开始装显卡驱动:sudo ./NVIDIA_driver_name.run -no-x-check -no-nouveau-check -no-opengl-files
安装过程中有图形界面可以一路选择,需要注意点,不过问题不大。安装完会自动退出安装界面,回到文本界面。
4. 再重启,NVIDIA驱动安装完成(可以nvidia-smi检查)。
再记录一下cuda9.0的安装:
理论上来说,用.run或者.deb文件都可以,这儿记录一下用.run来安装的过程。
1. 直接下载包,给权限,然后运行就可以了。注意提醒要不要安装NVIDIA驱动的时候,选no。提醒x-config类似物的时候,也选择n。opengl,还有sample,貌似无所谓,有或者没有应该都行吧。
2. 要添加环境变量。由于在别处找到了,直接插图了:
3. 完成之后重启。nvcc -V可以查看cuda版本,如果是对的那就ok了。
再记录一下cudnn的安装:
首先要下载到安装包。