ceph集群部署实验

存储：

RAID：独立磁盘冗余阵列

性能、容错、空间

分布式存储：CEPH

组成

ceph集群部署实验

MON：监视器。MON通过保存一系列集群状态map来监视集群的组件。MON因为保存集群状态，要防止单点故障，所以需要多台；另外，MON需要是奇数，如果出现意见分岐，采用投票机制，少数服从多数。
OSD：对象存储设备。真正存储数据的组件。一般来说，每块参与存储的磁盘都需要一个OSD进程。

（3）MDS：元数据服务器。只有CephFS需要它。

元数据：metadata，存储数据的数据。比如一本书内容是数据，那么书的作者、出版社、出版时间之类的信息就是元数据。

RADOS：可靠自主分布式对象存储。它是ceph存储的基础，保证一切都以对象形式存储。
RBD：RADOS块设备，提供块存储
CephFS：提供文件系统级别存储
RGW：RADOS网关，提供对象存储

存储分类：

块存储：提供硬盘，如iSCSI

文件级别存储：共享文件夹

对象存储：一切皆对象

http://storage.ctocio.com.cn/281/12110781_2.shtml

dba为日志储存的盘，会分区两个储存

dbc和dbd为储存盘，启动ecph时候看osd下面有这两个进程

注意点：主机名和本地解析域名要一致，不然会严重报错！！

ceph -s 可以看到是警告状态，是储存机器没找到（比如node2没找到没连接上）

CEPH环境准备

准备6台虚拟机

主机名、IP地址

在物理主机上配置名称解析

[[email protected] nsd2018]# for i in {1..6}

> do

> echo -e "192.168.4.$i\tnode$i.tedu.cn\tnode$i" >> /etc/hosts

> done

3、提前将服务器的**保存，不需要ssh时回答yes

[[email protected] nsd2018]# ssh-keyscan node{1..6} >> /root/.ssh/known_hosts

4、实现免密登陆

[[email protected] nsd2018]# for i in {1..6}

> do

> ssh-copy-id node$i

> done

5、配置yum源

[[email protected] nsd2018]# mkdir /var/ftp/ceph/

[[email protected] nsd2018]# vim /etc/fstab

/ISO/rhcs2.0-rhosp9-20161113-x86_64.iso /var/ftp/ceph iso9660 defaults 0 0

[[email protected] nsd2018]# mount -a

[[email protected] nsd2018]# vim /tmp/server.repo

[rhel7.4]

name=rhel7.4

baseurl=ftp://192.168.4.254/rhel7.4

enabled=1

gpgcheck=0

[mon]

name=mon

baseurl=ftp://192.168.4.254/ceph/rhceph-2.0-rhel-7-x86_64/MON

enabled=1

gpgcheck=0

[osd]

name=osd

baseurl=ftp://192.168.4.254/ceph/rhceph-2.0-rhel-7-x86_64/OSD

enabled=1

gpgcheck=0

[tools]

name=tools

baseurl=ftp://192.168.4.254/ceph/rhceph-2.0-rhel-7-x86_64/Tools

enabled=1

gpgcheck=0

[[email protected] nsd2018]# for vm in node{1..6}

> do

> scp /tmp/server.repo ${vm}:/etc/yum.repos.d/

> done

配置node1节点为管理节点

配置名称解析

[[email protected] ~]# for i in {1..6}; do echo -e "192.168.4.$i\tnode$i.tedu.cn\tnode$i" >> /etc/hosts; done

配置免密登陆

[[email protected] ~]# ssh-keyscan node{1..6} >> /root/.ssh/known_hosts

[[email protected] ~]# ssh-****** -f /root/.ssh/id_rsa -N ''

[[email protected] ~]# for i in {1..6}; do ssh-copy-id node$i; done

[[email protected] ~]# for vm in node{1..6}

> do

> scp /etc/hosts ${vm}:/etc/

> done

7、NTP网络时间协议，基于UDP123端口。用于时间同步

时区：地球一圈360度，经度每15度角一个时区，共24个时区。以英国格林威治这个城市所在纵切面为基准。北京在东八区。

夏季节约时间：夏令时。DST

Stratum：时间服务器的层级。

时间准确度：原子钟。

8、配置node6为时间服务器

（1）配置

[[email protected] ~]# yum install -y chrony

[[email protected] ~]# vim /etc/chrony.conf

server 0.centos.pool.ntp.org iburst

#server 1.centos.pool.ntp.org iburst

#server 2.centos.pool.ntp.org iburst

#server 3.centos.pool.ntp.org iburst

allow 192.168.4.0/24

local stratum 10

启动服务

[[email protected] ~]# systemctl enable chronyd

[[email protected] ~]# systemctl restart chronyd

将node1-5配置为NTP的客户端

（1）配置

[[email protected] ~]# vim /etc/chrony.conf

#server 0.rhel.pool.ntp.org iburst

#server 1.rhel.pool.ntp.org iburst

#server 2.rhel.pool.ntp.org iburst

#server 3.rhel.pool.ntp.org iburst

server 192.168.4.6 iburst

[[email protected] ~]# systemctl restart chronyd

测试

[[email protected] ~]# date -s "2018-7-13 12:00:00"

[[email protected] ~]# ntpdate 192.168.4.6

[[email protected] ~]# date

（3）同步其他主机

[[email protected] ~]# for i in {2..5}

> do

> scp /etc/chrony.conf node$i:/etc/

> done

[[email protected] ~]# for vm in node{2..5}

> do

> ssh $vm systemctl restart chronyd

> done

9、为node1-3各添加3块10GB的磁盘

可以在虚拟机不关机的情况下，直接添加硬盘

安装ceph

在node1上安装部署软件

[[email protected] ~]# yum install -y ceph-deploy

[[email protected] ~]# mkdir ceph-clu

创建参与集群节点的配置文件

[[email protected] ceph-clu]# ceph-deploy new node{1..3}

[[email protected] ceph-clu]# ls

4、在3个节点上安装软件包

[[email protected] ceph-clu]# ceph-deploy install node{1..3}

初始化mon服务

[[email protected] ceph-clu]# ceph-deploy mon create-initial

如果出现以下错误：

[node1][ERROR ] admin_socket: exception getting command descriptions: [Errno 2] No such file or directory

解决方案：

[[email protected] ceph-clu]# vim ceph.conf 最下面加入行：

public_network = 192.168.4.0/24

再执行以下命令：

[[email protected] ceoh-clu]# ceph-deploy --overwrite-conf config push node1 node2 node3

把node1-3的vdb作为日志盘。Ext／xfs都是日志文件系统，一个分区分成日志区和数据区。为了更好的性能，vdb专门作为vdc和vdd的日志盘。

[[email protected] ceph-clu]# for vm in node{1..3}

> do

> ssh $vm parted /dev/vdb mklabel gpt

> done

[[email protected] ceph-clu]# for vm in node{1..3}; do ssh $vm parted /dev/vdb mkpart primary 1M 50% ; done

[[email protected] ceph-clu]# for vm in node{1..3}; do ssh $vm parted /dev/vdb mkpart primary 50% 100% ; done

[[email protected] ceph-clu]# for vm in node{1..3}; do ssh ${vm} chown ceph.ceph /dev/vdb? ; done

创建OSD设备

[[email protected] ceph-clu]# for i in {1..3}

> do

> ceph-deploy disk zap node$i:vdc node$i:vdd

> done

[[email protected] ceph-clu]# for i in {1..3}

> do

> ceph-deploy osd create node$i:vdc:/dev/vdb1 node$i:vdd:/dev/vdb2

> done

验证

到第7步为止，ceph已经搭建完成。查看ceph状态

[[email protected] ceph-clu]# ceph -s 如果出现health HEALTH_OK表示正常

排错

https://www.zybuluo.com/dyj2017/note/920621

CEPH应用

块存储：使用最多的一种方式
cephFS：了解，不建议在生产环境中使用，因为还不成熟
对象存储：了解，使用亚马逊的s3

使用RBD(Rados块设备)

查看存储池

[[email protected] ~]# ceph osd lspools

可以查看到0号镜像池，名字为rbd

创建名为demo-img的镜像大小为10GB

[[email protected] ~]# rbd create demo-img --image-feature layering --size 10G

[[email protected] ~]# rbd list

[[email protected] ~]# rbd info demo-img

3、创建第2个镜像，名为image，指定它位于rbd池中

[[email protected] ~]# rbd create rbd/image --image-feature layering --size 10G

编写UDEV规则，使得vdb1和vdb2重启后，属主属组仍然是ceph

[[email protected] ~]# vim /etc/udev/rules.d/90-cephdisk.rules

ACTION=="add", KERNEL=="vdb[12]", OWNER="ceph", GROUP="ceph"