MySQL的高可用方案有很多,比如Cluster,MMM,MHA,DRBD等,这些都比较复杂,我前面的文章也有介绍。最近Oracle官方也推出了Fabric。有时我们不需要这么复杂的环境,这些方案各有优劣。有时简单的且我们能够hold住的方案才是适合我们的。比如MySQL Replication,然后加上各种高可用软件,比如Keepalived等,就能实现我们需要的高可用环境。
MySQL架构为master/slave,当master故障时,vip漂移到slave上。提供服务。当然也可以设置为双master,但是不是每个方案都是完美的。这里设置为双master有个问题需要注意,比如,当用户发表文章时,由于此时主机的压力很大时,假设落后2000秒,那么这台主机宕机了,另一台主机接管(vip漂移到从机上)时,因为同步延时大,用户刚才发表的文章还没复制过来,于是用户又发表了一遍文章,当原来的master修复好后,由于I/O和SQL线程还处于开启状态,因此还会继续同步刚才没有同步复制完的数据,这时有可能把用户新发表的文章更改掉。这里所以采用master/slave架构。在这种架构中,故障切换以后,采取手动操作的方式与新的master进行复制。
简单环境如下:
master 192.168.0.100 slave 192.168.0.101 VIP 192.168.0.88
主从复制环境的搭建我这里就不演示了。有需要的同学自己看看官方手册。下面直接介绍keepalived的安装及配置使用。
1.keepalived软件安装(主从操作一样)
[root@mysql-server-01 ~]# wget -q http://www.keepalived.org/software/keepalived-1.2.13.tar.gz [root@mysql-server-01 ~]# tar xf keepalived-1.2.13.tar.gz [root@mysql-server-01 ~]# cd keepalived-1.2.13 [root@mysql-server-01 keepalived-1.2.13]# ./configure && make && make install
[root@mysql-server-01 keepalived]# cp /usr/local/etc/rc.d/init.d/keepalived /etc/rc.d/init.d/ [root@mysql-server-01 keepalived]# cp /usr/local/etc/sysconfig/keepalived /etc/sysconfig/ [root@mysql-server-01 keepalived]# mkdir /etc/keepalived [root@mysql-server-01 keepalived]# cp /usr/local/etc/keepalived/keepalived.conf /etc/keepalived/ [root@mysql-server-01 keepalived]# cp /usr/local/sbin/keepalived /usr/sbin/ [root@mysql-server-01 keepalived]# chkconfig --add keepalived [root@mysql-server-01 keepalived]# chkconfig --level 345 keepalived on
2.主从的配置文件修改(主的keepalived配置文件修改后如下,其实不相同的就优先级而已)
master的keepalived配置文件如下
[root@mysql-server-01 keepalived]# cat keepalived.conf global_defs { router_id MySQL-HA } vrrp_script check_run { script "/data/sh/mysql_check.sh" interval 300 } vrrp_sync_group VG1 { group { VI_1 } } vrrp_instance VI_1 { state BACKUP interface eth1 virtual_router_id 51 priority 100 advert_int 1 nopreempt authentication { auth_type PASS auth_pass 1111 } track_script { check_run } notify_master /data/sh/master.sh notify_backup /data/sh/backup.sh notify_stop /data/sh/stop.sh virtual_ipaddress { 192.168.0.88 } } [root@mysql-server-01 keepalived]#
slave的keepalived配置文件修改以后如下:
[root@mysql-server-02 keepalived]# cat keepalived.conf global_defs { router_id MySQL-HA } vrrp_script check_run { script "/data/sh/mysql_check.sh" interval 300 } vrrp_sync_group VG1 { group { VI_1 } } vrrp_instance VI_1 { state BACKUP interface eth1 virtual_router_id 51 priority 90 advert_int 1 authentication { auth_type PASS auth_pass 1111 } track_script { check_run } notify_master /data/sh/master.sh notify_backup /data/sh/backup.sh notify_stop /data/sh/stop.sh virtual_ipaddress { 192.168.0.88 } } [root@mysql-server-02 keepalived]#
其中有几个关键参数的地方:
notify_master:状态改变为master以后执行的脚本。
notify_backup: 状态改变为backup以后执行的脚本。
notify_fault: 状态改变为fault后执行的脚本。
notify_stop: VRRP停止以后执行的脚本。
state backup:我们都设置为了backup,就是为了发生故障以后不会自动切换。
nopreempt: 不进行抢占操作
其中用到了这4个脚本:backup.sh master.sh mysql_check.sh stop.sh
mysql_check.sh是为了检查mysqld进程是否存活的脚本,当发现连接不上mysql,自动把keepalived进程干掉,让VIP进行漂移。
下面的脚本主从服务器上面都有,只是从服务器上面的master.sh有些不一样。添加了当slave提升为主库时,发送邮件通知。
[root@mysql-server-01 sh]# cat mysql_check.sh #!/bin/bash . /root/.bash_profile count=1 while true do mysql -uroot -pmsandbox -S /tmp/mysql_sandbox14520.sock -e "show status;" > /dev/null 2>&1 i=$? ps aux | grep mysqld | grep -v grep > /dev/null 2>&1 j=$? if [ $i = 0 ] && [ $j = 0 ] then exit 0 else if [ $i = 1 ] && [ $j = 0 ] then exit 0 else if [ $count -gt 5 ] then break fi let count++ continue fi fi done /etc/init.d/keepalived stop [root@mysql-server-01 sh]#