关于NVIDIA驱动和cuda安装的成功经验记录

由于搞deep learning的需要，在Ubuntu系统下安装cuda成为刚需。

当前的tensorflow，pytorch等框架需要cuda的较新版本，所以安装方法有可能需要不断踩坑改进。这篇blog记录一下最新的成功经验。

现在才开始记录，之前没有记录，主要原因是，之前安装有点太顺利了。先前，Ubuntu连上中国科大的源（mirrors.ustc.edu.cn），可以自动检索可更新的驱动，就可以安装成功。但是目前这种方法不管用了，不知道之后中国科大的源会不会再更新，不过最好还是脱离那个来安装比较好。比较方便follow不断更新的新版本。

先记录一下NVIDIA驱动的安装：

1. 在官网下载正确版本的驱动（中文官网下载速度快一些，注意版本，版本错了有可能会造成图形界面的循环登陆问题）。给予权限，sudo chmod +x ./NVIDIA_driver_name.run，至此安装文件已经准备好。

2. 禁用nouveau。具体操作是：编辑文件sudo gedit /etc/modprobe.d/blacklist-nouveau.conf，添加两行：

blacklist nouveau

options nouveau modeset=0

然后保存。之后需要重新生成 kernel initramfs：

sudo update-initramfs -u

然后重启

3. 重启之后，正常情况是图形界面进不去了，开机之后应该是进入ctrl+alt+F1。先运行：

sudo service lightdm stop

然后就可以开始装显卡驱动：sudo ./NVIDIA_driver_name.run -no-x-check -no-nouveau-check -no-opengl-files

安装过程中有图形界面可以一路选择，需要注意点，不过问题不大。安装完会自动退出安装界面，回到文本界面。

4. 再重启，NVIDIA驱动安装完成（可以nvidia-smi检查）。

再记录一下cuda9.0的安装：

理论上来说，用.run或者.deb文件都可以，这儿记录一下用.run来安装的过程。

1. 直接下载包，给权限，然后运行就可以了。注意提醒要不要安装NVIDIA驱动的时候，选no。提醒x-config类似物的时候，也选择n。opengl，还有sample，貌似无所谓，有或者没有应该都行吧。

2. 要添加环境变量。由于在别处找到了，直接插图了：

关于NVIDIA驱动和cuda安装的成功经验记录

3. 完成之后重启。nvcc -V可以查看cuda版本，如果是对的那就ok了。

再记录一下cudnn的安装：

首先要下载到安装包。

关于NVIDIA驱动和cuda安装的成功经验记录