本文教程适用于刚安装好的Ubuntu 16.04
一、初始工作
1. 换源:aliyun
2. 更新
sudo apt-get upgrade
二、检测NVIDIA显卡驱动
1. 在终端输入
nvidia-smi
若出现下图,则说明NVIDIA 显卡已经安装
2. 若出现command no found,则需要先安装NVIDIA 显卡,先到NVDIA官网查看对应的驱动程序的版本:
本人显卡为GeFprce GTX 960M
3. 然后在终端输入
sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt-get update
sudo apt-get install nvidia-390 #此处要根据上面查询到的版本适当更改
sudo apt-get install mesa-common-dev
sudo apt-get install freeglut3-dev
4. 重启之后在终端内输入:
nvidia-smi
三、安装Cuda
本人安装的Cuda版本为9.0
1. 到NVIDIA官网下载相应的CUDA版本的run 文件
2. cd 到run文件所在目录,输入
sudo sh cuda_9.0.176_384.81_linux.run
3. 安装协议可以使用q跳过,显示第一个问题询问是否安装驱动。因为前面我们已经安装了驱动,所以我们不安装。
....
....
Do you accept the previously read EULA?
accept/decline/quit:accept
Install NVIDIA Accelerated Graphics Driver for Linux-x86_64 367.48?
(y)es/(n)o/(q)uit: n
4. 有问题就选择y,询问路径就回车默认设置。
Install the CUDA 8.0 Toolkit?
(y)es/(n)o/(q)uit: y
Enter Toolkit Location
[ default is /usr/local/cuda-8.0 ]: y
Toolkit location must be an absolute path.
Enter Toolkit Location
[ default is /usr/local/cuda-8.0 ]:
Do you want to install a symbolic link at /usr/local/cuda?
(y)es/(n)o/(q)uit: y
Install the CUDA 8.0 Samples?
(y)es/(n)o/(q)uit: y
Enter CUDA Samples Location
[ default is /home/mike ]:
Installing the CUDA Toolkit in /usr/local/cuda-8.0 ...
正常的话就不会在显示文件缺失,然后安装成功。如果安装成功可以跳到第9步:
5. 本人在此遇到的问题:在这里根据不同系统会有2个或4个文件缺失。我的缺了两个动态链接库文件。
Missing recommended library: libXi.so
Missing recommended library: libXmu.so
使用apt补一下,参考自 stackoverflow。
$ sudo apt-get install nvidia-modprobe freeglut3-dev libx11-dev libxmu-dev libxi-dev libglu1-mesa-dev
6. 安装好上面几个包后要重启系统
7. 卸载
cd /usr/local/cuda/bin/
sudo ./uninstall_cuda_9.0.pl
8. 然后再重新安装CUDA包。
9. 在~/.bashrc 文件中输入
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-9.0/lib64
export PATH=$PATH:/usr/local/cuda-9.0/bin
export CUDA_HOME=$CUDA_HOME:/usr/local/cuda-9.0
10. 检测一下是否安装成功,在新打开的终端输入:
四、安装cuDNN
1. 登录 NVIDIA 账号下载对应Cuda的cuDNN 版本 (本人安装 cuDNN v7.2.1 for CUDA 9.0,cuDNN v7.1.4 Runtime Library for Ubuntu16.04 (Deb))
2. cd到下载文件的路径,输入以下进行安装
sudo dpkg -i libcudnn7_7.2.1.38-1+cuda9.0_amd64.deb
3 . 注意,这里如果安装7.1.4或之前版本的cuDNN将由于版本问题无法进行在本文章中最后的例程。
五、安装Anaconda
1. 下载 Anaconda : https://www.anaconda.com/download/#linux/ , 如下载的包为: Anaconda2-5.0.0.1-Linux-x86_64.sh
2. 安装 Anaconda: 在shell命令行输入bash Anaconda2-5.0.0.1-Linux-x86_64.sh,根据下面的官方安装指导网站的4步进行安装,通常所有选项都是yes,但本人在安装VScode的一项中无法链接网络,所以在这一项选择no。
http://docs.anaconda.com/anaconda/install/linux/
(记住在上面面网站的第7步要选择yes,否则要自己手动添加相应路径到~/.bashrc)
# added by Anaconda3 5.3.0 installer
# >>> conda init >>>
# !! Contents within this block are managed by 'conda init' !!
__conda_setup="$(CONDA_REPORT_ERRORS=false '/home/bourne/anaconda3/bin/conda' shell.bash hook 2> /dev/null)"
if [ $? -eq 0 ]; then
\eval "$__conda_setup"
else
if [ -f "/home/bourne/anaconda3/etc/profile.d/conda.sh" ]; then
. "/home/bourne/anaconda3/etc/profile.d/conda.sh"
CONDA_CHANGEPS1=false conda activate base
else
\export PATH="/home/bourne/anaconda3/bin:$PATH"
fi
fi
unset __conda_setup
# <<< conda init <<<
3. 创建终端输入以下创建linux python 3环境,其中tfgpu-py36是环境名称,python=3.6 是python版本
conda create -n tfgpu-py36 python=3.6
4. **环境:
source activate gputf-py36
出现用户名前面有 (gputf-py36) 字样则安装成功。如下图所示:
六、安装tensorflow的GPU版本
在进入conda的虚拟环境后,输入以下指令安装tensorflow的GPU版本
pip install --ignore-installed --upgrade https://download.tensorflow.google.cn/linux/gpu/tensorflow_gpu-1.11.0-cp36-cp36m-linux_x86_64.whl
七、下载tensorflow例程
cd 到home或者Download目录下载例程,在本文是用来测试上述所有软件是否已经安装好,大家也可以用来学习tensorflow
git clone https://github.com/hzy46/Deep-Learning-21-Examples.git
(本人是刚安装好的系统,因此要先apt install git)
八、运行例程
在conda的虚拟环境下cd到刚刚下载的例程的chapter 1,然后按照以下网站进行测试
https://github.com/hzy46/Deep-Learning-21-Examples/tree/master/chapter_1
出现下面的训练结果的时候(traning accuracy),说明已经大功告成,可以利用GPU进行tensorflow的训练!
注意:运行下面指令的时候,会发生无法导入toimage的情况,应该是版本的问题,不影响后测试,因此本人选择忽略。
python save_pic.py