前言
有时我们在服务器中需要配置不同的深度学习环境来进行模型训练,特别是服务器共享时,无法在同一个环境中进行模型训练。这时安装docker,在docker里配置不同的环境即可解决这个问题,也便于管理。
一、安装docker-ce
1、使用apt-get 指令进行安装,不要将apt-get 指令替换为阿里源或者清华源等国内镜像,由于国内镜像源更新不到位,安装docker 时会出现bug,使用系统自带的即可。具体步骤如下所示:
(1)
sudo apt-get update
注:可能遇到如图1.1 所示的错误,解决方案,将keys更改为报错的**:
sudo apt-key adv --keyserver keyserver.ubuntu.com --recv-keys 7EA0A9C3F273FCD8
(2)
sudo dpkg --configure -a
(3)
sudo apt-get install apt-transport-https ca-certificates curl software-properties-common
安装部分截图如图1.2 所示
curl -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo apt-key add -
注:显示‘‘OK’’即成功,可能遇到图1.3 所示的错误,解决方案见链接:
sudo add-apt-repository “deb [arch=amd64] https://download.docker.com/linux/ubuntu $(lsb_release -cs) stable”
注:如果是arm 架构的需要替换为‘‘arch=arm64’’,比如jetson nano、TX2、NX、AGX
(6)
sudo apt-get update
(7)查看docker-ce 版本,如图1.4 所示
apt-cache madison docker-ce
sudo apt-get install docker-ce=5:19.03.113-0ubuntu-bionic
(9)验证是否安装成功,出现如下图1.5 所示时即安装成功
sudo docker run hello-world
docker --version
二、安装nvidia-docker
安装好了普通的Docker 以后,如果想在容器内使用GPU 会非常麻烦(并不是不可行),好在Nvidia 为了让大家能在容器中愉快使用GPU,基于Docker 开发了Nvidia-Docker,使得在容器中深度学习框架调用GPU 变得极为容易。按以下步骤进行nvidia-docker 的安装。
注:安装nvidia-docker 之前必须安装显卡驱动,以下方法适用于docker-ce 19.03(或19.03之后的版本)
(1)
distribution=$(. /etc/os-release;echo VERSION_ID)
(2)
curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add -
(3)
curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.list
(4)安装后部分截图如图1.7 所示
sudo apt-get update && sudo apt-get install -y nvidia-container-toolkit
sudo systemctl restart docker
(6)测试nvidia-docker 是否安装成功,如图1.8 所示即安装成功,也会显示安装的显卡信息
sudo docker run --gpus all nvidia/cuda:10.2-base nvidia-smi
至此,docker的安装已经结束。