Ubuntu 16.04配置 Cuda, Cudnn, Anaconda, Tensorflow (GPU)

本文教程适用于刚安装好的Ubuntu 16.04

一、初始工作

1. 换源：aliyun

2. 更新

sudo apt-get upgrade

二、检测NVIDIA显卡驱动

1. 在终端输入

nvidia-smi

若出现下图，则说明NVIDIA 显卡已经安装

Ubuntu 16.04配置 Cuda, Cudnn, Anaconda, Tensorflow (GPU)

2. 若出现command no found，则需要先安装NVIDIA 显卡，先到NVDIA官网查看对应的驱动程序的版本：

本人显卡为GeFprce GTX 960M

Ubuntu 16.04配置 Cuda, Cudnn, Anaconda, Tensorflow (GPU)

3. 然后在终端输入

sudo add-apt-repository ppa:graphics-drivers/ppa 
sudo apt-get update 
sudo apt-get install nvidia-390 #此处要根据上面查询到的版本适当更改 
sudo apt-get install mesa-common-dev 
sudo apt-get install freeglut3-dev

4. 重启之后在终端内输入：

nvidia-smi

`三、安装Cuda`

本人安装的Cuda版本为9.0

1. 到NVIDIA官网下载相应的CUDA版本的run 文件

Ubuntu 16.04配置 Cuda, Cudnn, Anaconda, Tensorflow (GPU)

2. cd 到run文件所在目录，输入

sudo sh cuda_9.0.176_384.81_linux.run

3. 安装协议可以使用q跳过，显示第一个问题询问是否安装驱动。因为前面我们已经安装了驱动，所以我们不安装。

....
....

Do you accept the previously read EULA?
accept/decline/quit:accept

Install NVIDIA Accelerated Graphics Driver for Linux-x86_64 367.48?
(y)es/(n)o/(q)uit: n

4. 有问题就选择y，询问路径就回车默认设置。

Install the CUDA 8.0 Toolkit?
(y)es/(n)o/(q)uit: y

Enter Toolkit Location
 [ default is /usr/local/cuda-8.0 ]: y

Toolkit location must be an absolute path.
Enter Toolkit Location
 [ default is /usr/local/cuda-8.0 ]: 

Do you want to install a symbolic link at /usr/local/cuda?
(y)es/(n)o/(q)uit: y

Install the CUDA 8.0 Samples?
(y)es/(n)o/(q)uit: y

Enter CUDA Samples Location
 [ default is /home/mike ]: 

Installing the CUDA Toolkit in /usr/local/cuda-8.0 ...

正常的话就不会在显示文件缺失，然后安装成功。如果安装成功可以跳到第9步：

5. 本人在此遇到的问题：在这里根据不同系统会有2个或4个文件缺失。我的缺了两个动态链接库文件。

Missing recommended library: libXi.so
Missing recommended library: libXmu.so

使用apt补一下，参考自 stackoverflow。

$ sudo apt-get install nvidia-modprobe freeglut3-dev libx11-dev libxmu-dev libxi-dev libglu1-mesa-dev

6. 安装好上面几个包后要重启系统

7. 卸载

cd /usr/local/cuda/bin/
sudo ./uninstall_cuda_9.0.pl

8. 然后再重新安装CUDA包。

9. 在~/.bashrc 文件中输入

export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-9.0/lib64 
export PATH=$PATH:/usr/local/cuda-9.0/bin 
export CUDA_HOME=$CUDA_HOME:/usr/local/cuda-9.0

10. 检测一下是否安装成功，在新打开的终端输入：

四、安装cuDNN

1. 登录　NVIDIA 账号下载对应Cuda的cuDNN 版本（本人安装 cuDNN v7.2.1 for CUDA 9.0，cuDNN v7.1.4 Runtime Library for Ubuntu16.04 (Deb)）

2. cd到下载文件的路径，输入以下进行安装

sudo dpkg -i libcudnn7_7.2.1.38-1+cuda9.0_amd64.deb

3 . 注意，这里如果安装7.1.4或之前版本的cuDNN将由于版本问题无法进行在本文章中最后的例程。

五、安装Anaconda

1. 下载 Anaconda ： https://www.anaconda.com/download/#linux/ ，如下载的包为: Anaconda2-5.0.0.1-Linux-x86_64.sh

2. 安装 Anaconda：在shell命令行输入bash Anaconda2-5.0.0.1-Linux-x86_64.sh，根据下面的官方安装指导网站的4步进行安装，通常所有选项都是yes，但本人在安装VScode的一项中无法链接网络，所以在这一项选择no。

http://docs.anaconda.com/anaconda/install/linux/

（记住在上面面网站的第7步要选择yes，否则要自己手动添加相应路径到~/.bashrc）

# added by Anaconda3 5.3.0 installer
# >>> conda init >>>
# !! Contents within this block are managed by 'conda init' !!
__conda_setup="$(CONDA_REPORT_ERRORS=false '/home/bourne/anaconda3/bin/conda' shell.bash hook 2> /dev/null)"
if [ $? -eq 0 ]; then
    \eval "$__conda_setup"
else
    if [ -f "/home/bourne/anaconda3/etc/profile.d/conda.sh" ]; then
        . "/home/bourne/anaconda3/etc/profile.d/conda.sh"
        CONDA_CHANGEPS1=false conda activate base
    else
        \export PATH="/home/bourne/anaconda3/bin:$PATH"
    fi
fi
unset __conda_setup
# <<< conda init <<<

3. 创建终端输入以下创建linux python 3环境，其中tfgpu-py36是环境名称，python=3.6 是python版本

conda create -n tfgpu-py36 python=3.6

4. **环境：

source activate gputf-py36

出现用户名前面有 (gputf-py36) 字样则安装成功。如下图所示：

Ubuntu 16.04配置 Cuda, Cudnn, Anaconda, Tensorflow (GPU)

六、安装tensorflow的GPU版本

在进入conda的虚拟环境后，输入以下指令安装tensorflow的GPU版本

pip install --ignore-installed --upgrade https://download.tensorflow.google.cn/linux/gpu/tensorflow_gpu-1.11.0-cp36-cp36m-linux_x86_64.whl

七、下载tensorflow例程

cd 到home或者Download目录下载例程，在本文是用来测试上述所有软件是否已经安装好，大家也可以用来学习tensorflow

git clone https://github.com/hzy46/Deep-Learning-21-Examples.git

(本人是刚安装好的系统，因此要先apt install git)

八、运行例程

在conda的虚拟环境下cd到刚刚下载的例程的chapter 1，然后按照以下网站进行测试

https://github.com/hzy46/Deep-Learning-21-Examples/tree/master/chapter_1

出现下面的训练结果的时候（traning accuracy），说明已经大功告成，可以利用GPU进行tensorflow的训练！

Ubuntu 16.04配置 Cuda, Cudnn, Anaconda, Tensorflow (GPU)

注意：运行下面指令的时候，会发生无法导入toimage的情况，应该是版本的问题，不影响后测试，因此本人选择忽略。

python save_pic.py

Ubuntu 16.04配置 Cuda, Cudnn, Anaconda, Tensorflow (GPU)