一、硬件环境准备                                                                                                                            点击此处返回总目录

二、安装过程

三、常用的查看版本的命令

 

 

 

服务器:联想TS430

操作系统:ubuntu18.10

GPU:RTX2080Ti

CUDA10.0

cuDNN7.5.0

Anaconda:

Tensorflow:

 

软件列表:

NVIDIA-Linux-x86_64-418.43.run

cuda_10.0.130_410.48_ubuntu18.run

cudnn-10.0-linux-x64-v7.5.0.56.tgz

 

 

 

一、硬件环境准备

1. GPU为RTX2080Ti。

为最新款,是18年最好的GPU了,京东价9999一个。买来之后,只有一个GPU、一个转接头和两本小册子,如下:

 

              ubuntu18.10 + RTX2080Ti +  CUDA10.0 + cuDNN7.5.0 + Anaconda + TensorFlow 的安装

 

 

GPU长这样:

 

ubuntu18.10 + RTX2080Ti +  CUDA10.0 + cuDNN7.5.0 + Anaconda + TensorFlow 的安装    ubuntu18.10 + RTX2080Ti +  CUDA10.0 + cuDNN7.5.0 + Anaconda + TensorFlow 的安装   ubuntu18.10 + RTX2080Ti +  CUDA10.0 + cuDNN7.5.0 + Anaconda + TensorFlow 的安装

 

注意:买的时候是不带电源线的。要么跟供应商说,让他送电源线;要么自己去买电源线。电源线根据每个服务器的型号不同而不同,买之前要先看好。

 

2. 服务器。

我从实验室找了两台服务器,第一台是联想TS430。

 

ubuntu18.10 + RTX2080Ti +  CUDA10.0 + cuDNN7.5.0 + Anaconda + TensorFlow 的安装   ubuntu18.10 + RTX2080Ti +  CUDA10.0 + cuDNN7.5.0 + Anaconda + TensorFlow 的安装

 

联想T430电源是SATA的,所以我买了2根下面的线。接通之后能正常使用。

ubuntu18.10 + RTX2080Ti +  CUDA10.0 + cuDNN7.5.0 + Anaconda + TensorFlow 的安装

插上之后就可以开机,然后接上显示器看了。

需要注意的是显示器要插到GPU的口上,不能插在以前的口上了。

 

 

二、安装过程(还没写完,大家先不要参考)

 

步骤1:安装操作系统

略。

 

 

步骤2:安装显卡驱动

到官网上下载自己GPU对应版本的显卡驱动。

我下载的是NVIDIA-Linux-x86_64-418.43.run,有101M。

 

 

 

 

 

 

 

步骤3:安装CUDA

本人下载的是cuda_10.0.130_410.48_ubuntu18.run。之前下载过deb格式的。但是报以下错误:

ubuntu18.10 + RTX2080Ti +  CUDA10.0 + cuDNN7.5.0 + Anaconda + TensorFlow 的安装

原因要么是dpkg命令有问题,要么就是deb文件有问题。后来改成用.run文件,就没问题了。

 

 

下载完成后,执行:

sudo sh cuda_10.0.130_410.48_linux.run

 

执行此会出现 1%信息,此时长按回车键让此百分比增长,直到100%,然后按照提示操作即可。

先输入 accept 。又一个是选择是否安装 nvidia 驱动(大概是第3个),要输入“n”,因为已经安装过了。其他的选择则都输入“y”确认安装或确认默认路径安装即可。
 

 

【这一步可能遇到的问题】

在安装过程中,我遇到了一个问题,装不下去了。

后来查了一下,是因为gcc版本太高,用了以下方法解决的(其中还忘了更新g++,导致后面又出现了问题):

ubuntu18.10 + RTX2080Ti +  CUDA10.0 + cuDNN7.5.0 + Anaconda + TensorFlow 的安装

更改了gcc的版本之后,再运行.run文件就没问题了。

 

 

安装完之后,修改环境变量:

vim ~/.bashrc

增加以下几句话:

       ubuntu18.10 + RTX2080Ti +  CUDA10.0 + cuDNN7.5.0 + Anaconda + TensorFlow 的安装

然后使环境变量生效:

source ~/.bashrc

 

 

这样cuda就安装好了,此时需要验证以下有没有安装成功:


 

 

 

 

 

问题一:

ubuntu18.10 + RTX2080Ti +  CUDA10.0 + cuDNN7.5.0 + Anaconda + TensorFlow 的安装

 

【解决】

找不到g++编译器。

update-alternatives --install /usr/bin/g++ g++ /usr/bin/g++-5 50

ubuntu18.10 + RTX2080Ti +  CUDA10.0 + cuDNN7.5.0 + Anaconda + TensorFlow 的安装

 

 

 

 

问题二:

当执行他的例子时,遇到下面的问题:

       ubuntu18.10 + RTX2080Ti +  CUDA10.0 + cuDNN7.5.0 + Anaconda + TensorFlow 的安装

而且,使用nvidia-smi命令也报错:

       ubuntu18.10 + RTX2080Ti +  CUDA10.0 + cuDNN7.5.0 + Anaconda + TensorFlow 的安装

说是驱动的版本跟不上CUDA的版本,但是我查了一下,版本没有问题。

 

【分析】

CUDA driver version(驱动版本):就是NVIDIA GPU的驱动程序版本。CUDA runtime version(运行时版本):是在python中安装的cudatoolkit和cudnn程序包的版本。说是驱动的版本跟不上CUDA的版本。

一般来说,应该先查一下两者的版本是否匹配,然后再解决。但是我查了一下,版本没有问题,网上说的重启电脑的方法也不好使。

 

【解决方法】

先卸载掉nvidia驱动。然后再安装一次。

 

卸载的命令为:

sudo nvidia-uninstall

 

 

再次安装之后,就能正确显示了:

ubuntu18.10 + RTX2080Ti +  CUDA10.0 + cuDNN7.5.0 + Anaconda + TensorFlow 的安装

ubuntu18.10 + RTX2080Ti +  CUDA10.0 + cuDNN7.5.0 + Anaconda + TensorFlow 的安装

 

ubuntu18.10 + RTX2080Ti +  CUDA10.0 + cuDNN7.5.0 + Anaconda + TensorFlow 的安装

 

 

 

 

 

步骤4:安装cuDNN

首先下载cuDNN,要根据cuda的版本下载对应的cuDNN。

 

tar -xzvf cudnn-10.0-linux-x64-v7.3.1.20.tgz
$ sudo cp cuda/include/cudnn.h /usr/local/cuda/include 
$ sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64 
$ sudo chmod +r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*
 

 

 

 

 

 

三、常见的查看命令

1. cat /proc/driver/nvidia/version  或 nvidia-smi          //查看驱动版本。【例1】

2. nvcc -V                                                                   //查看cuda版本。【例2】

 

 

例1:

ubuntu18.10 + RTX2080Ti +  CUDA10.0 + cuDNN7.5.0 + Anaconda + TensorFlow 的安装

 

例2:

ubuntu18.10 + RTX2080Ti +  CUDA10.0 + cuDNN7.5.0 + Anaconda + TensorFlow 的安装

 

 

 

 

 

相关文章:

  • 2022-12-23
  • 2021-04-19
  • 2021-03-31
  • 2021-08-01
  • 2021-12-09
猜你喜欢
  • 2021-07-04
  • 2022-12-23
  • 2021-04-23
  • 2021-06-01
  • 2021-12-05
  • 2021-05-30
  • 2021-07-31
相关资源
相似解决方案