crmn

服务器双机热备预研

一、ServHA镜像双机热备软件方案预研

什么是双机热备方案

  双机热备就是使用互为备份的两台服务器共同执行同一服务,其中一台主机为工作机(Primary Server),另一台主机为备份机(Standby Server),保证系统不间断的运行。双机热备软件就是实现上述功能的软件产品。双机热备针对的是服务器的临时故障所做的一种备份技术,通过双机热备,来避免长时间的服务中断,保证系统长期、可靠的服务。

  企事业机构的信息化建设已经在随着社会建设的不断推进而改进和创新。众企事业机构的决策层也愈发重视企事业机构的信息化,不同程度的运营和发展着自身的业务信息系统。但是日趋普遍的业务信息系统在为企事业机构带来利益的同时,也存在着一个不容忽视的隐患——越来越多的业务依赖于业务信息系统。如果运行着关键业务信息系统的服务器发生宕机或是因为不可控的原因而停止,从而导致整个企事业机构的信息运营系统瘫痪,将会给企事业机构带来巨大的经济损失,而由于企事业机构的业务不能正常运行也会影响企事业机构的信誉,导致客户对企事业机构失去信任,从而带来致命的危害。

  通常,服务因错误而造成的终止不可避免,为此,企事业机构都会安排相关的管理人员进行定时的监控,一旦发现服务不可用,便会立即进行处理、排错。这是非常原始的解决方案,存在诸多问题,譬如及时性问题,一旦故障突然发生, 而人工不可能24小时监控;再譬如处理时间长短不可控,一旦错误造成的原因非常复杂,排错非常困难,需要非常长的时间,那么服务的终止将非常长。在排错过程中,人为操作失误将可能导致系统的永久瘫痪。另一方面,为了维持系统的高可用性而配备操作人员,劳务费用也非常昂贵。

  可见,业务信息系统的容错性和不间断性对需要保障信息安全和提供不间断的信息服务的企事业机构至关重要。而当今企事业机构和IT领域急需解决的关键问题在于如何保障各种关键应用的不间断运营,达到持久稳定的良性循环。

  为了解决上述问题,一般采用双机热备解决方案,也就是通过硬件冗余再配合高可用双机热备软件实现的解决方案,高可用双机热备软件自动检测服务的运行状态,当主服务器发生故障,高可用双机热备软件会自动尝试修复故障或启动备用服务器,保证我们的服务不间断运行。

双机热备方案及不同方案的要求、方案对比

2.1 双机热备方案概述

  一般实现双机热备的方案有三种,分别是镜像双机热备方案、共享存储双机热备方案、双机双柜双机热备方案,这三种方案对硬件要求不同,我们可以根据自身的业务应用特性来选择具体的双机热备方案以及对应的ServHA双机热备软件产品。

         

2.2 镜像双机热备方案

 

2.2.1 镜像双机热备方案简介及拓扑(优先选择)

 

  镜像双机热备方案中仅需要两台服务器即可实现双机热备,两台服务器利用本地磁盘存储业务数据,ServHA镜像双机热备软件(ServHA Mirror)负责实时同步两台服务器数据,保证两台服务器数据完全一致,由主服务器对外服务并将业务数据实时同步至备用服务器,一旦主服务器发生故障(例如:操作系统宕机、服务器意外掉电、网络故障等),由ServHA双机热备软件自动将业务应用切换至备用服务器继续对外服务,保护业务应用不间断运行。系统拓扑如下:

 

 

2.2.2 镜像双机热备方案软硬件要求

 

类别

内容

数量

备注

硬件

服务器

2

每台服务器至少两个网口

操作系统

Windows/Linux

--

两台服务器操作系统一致

网络

--

--

两台服务器在同一个网段下

双机热备软件

ServHA Mirror v3.5

1

ServHA镜像双机热备软件产品

 

2.2.3 镜像双机热备方案优缺点

  优点:性价比最高,硬件投入较少,只需要两台服务器即可,同时数据双份存储,两台服务器各一份,能够进行历史数据快照和查看历史数据能力,数据安全性更高。

  缺点:数据通过网络实时同步,不适合数据吞吐量特别大的系统。

 

2.2.4 补充说明

实时同步是基于磁盘块的实时同步,数据同步实时性极高,写入数据后,对机可立刻访问到该数据,即使意外宕机也不会造成数据的不一致。

    切换是指一次故障转移的过程,即将服务从主服务器转移到备用服务的过程,具体切换流程如下:

    (1)、主服务器停止应用服务,如数据库等。

    (2)、主服务器释放镜像数据访问权。

    (3)、主服务器释放虚拟IP。

    (4)、备用服务器挂载虚拟IP。

    (5)、备用服务器获取镜像数据访问权。

    (6)、备用服务器启动应用服务。

    切换时间为软件监测时间10s,加上相关业务应用程序启动时间。

    软件里可以设置主机运行的优先顺序,即主服务器和备用服务器的主备功能设置可以通过该款软件人工设置。

2.2.5 其他

    试用期20天,报价约¥12000元。

2.3 共享存储双机热备方案

 

2.3.1 共享存储双机热备方案简介及拓扑

  共享存储双机热备方案中需要两台服务器以及一台共享存储设备(一般情况下就是共享磁盘阵列柜),共享存储设备同时连接至两台服务器,用户业务数据存储在共享存储设备中,由主服务器对外服务并访问共享存储设备进行数据读写,一旦主服务器发生故障(例如:操作系统宕机、服务器意外掉电、网络故障等),由ServHA双机热备软件自动将业务应用切换至备用服务器并接管共享存储设备的访问权继续对外服务,保护业务应用不间断运行。系统拓扑如下:

 

       

2.3.2 共享存储双机热备方案软硬件要求

 

类别

内容

数量

备注

硬件

服务器

2

每台服务器至少两个网口

磁盘阵列柜

1

同时连接至两台服务器

操作系统

Windows/Linux

--

两台服务器操作系统一致

网络

--

--

两台服务器在同一个网段下

双机热备软件

ServHA Cluster v3.5

1

ServHA共享存储双机热备软件产品

 

2.3.3 共享存储双机热备方案优缺点

  优点:有独立的存储设备进行数据存储,能够容纳较高的数据吞吐量和具有较好的数据扩展性,适合数据量以及数据吞吐量比较大的应用。

  缺点:需要引入昂贵的存储设备,成本有所增加,数据只有一份,在磁盘阵列中。

 

2.4 双机双柜双机热备方案

 

2.4.1 双机双柜双机热备方案简介及拓扑

 

双机双柜双机热备方案中仅需要两台服务器和两台共享磁盘阵列柜,每台服务器同时连接两台磁盘阵列柜,每台磁盘阵列柜同时同时连接两台服务器,ServHA双机双柜软件(ServHA DS Mirror)负责实时将数据写入两台磁盘阵列柜,保证两台磁盘阵列柜数据完全一致,在服务器读取数据时,会从两台磁盘阵列柜同时读取,提高读取效率,一旦主服务器发生故障(例如:操作系统宕机、服务器意外掉电、网络故障等),由ServHA双机热备软件自动将业务应用切换至备用服务器继续对外服务,保护业务应用不间断运行,当一台磁盘阵列柜发生故障时,ServHA双机热备软件会将故障磁盘阵列柜隔离,整个过程业务不间断,无缝使用单盘柜继续服务。系统拓扑如下:

 

 

2.4.2 双机双柜双机热备方案软硬件要求

 

类别

内容

数量

备注

硬件

服务器

2

每台服务器至少两个网口

磁盘阵列柜

2

每台磁盘阵列柜同时连接至两台服务器

操作系统

Windows

--

两台服务器操作系统一致

网络

--

--

两台服务器在同一个网段下

双机热备软件

ServHA DS Mirror v3.5

1

ServHA共享存储双机热备软件产品

 

2.4.3 双机双柜双机热备方案优缺点

  优点:数据双份存储,两台磁盘阵列柜各一份,数据安全性高,数据通过存储链路实时写入两台磁盘阵列柜,能承载较高的数据吞吐量。

  缺点:硬件成本较高。

 

如何选择双机热备方案及双机热备软件

3.1 根据应用特性选择

   若用户应用要求数据吞吐量一般(每小时新增数据100G以下),更关注业务连续性(例如财务系统、OA系统、CRM系统等),可采用镜像双机热备方案,性价比高,数据安全性高,采用ServHAMirror双机热备软件产品。

   若用户应用要求数据吞吐量较高(每小时新增数据100G以上)、数据总量巨大且需要空间扩展,且关注业务连续性(例如视频监控、PACS、CRM系统等),可采用共享存储双机热备方案,采用ServHACluster双机热备软件产品。

   若用户应用要求数据吞吐量较高(每小时新增数据100G以上)、预算充足、对数据安全性有很高要求、数据总量巨大且需要空间扩展,可采用双机双柜双机热备方案,采用ServHA DS Mirror双机热备软件产品。

 

3.2 根据硬件配备选择

   若用户已经拥有一台服务器,可再增置一台服务器,采用镜像双机热备方案,对应双机热备软件产品为ServHA Mirror。

   若用户已经拥有一台服务器以及一台独存储设备,可再增置一台服务器,采用共享存储双机热备方案,对应双机热备软件产品为ServHA Cluster。

   若用户已经拥有两台台服务器,可以采用镜像双机热备方案,对应双机热备软件产品为ServHA Mirror。

   若用户已经拥有两台台服务器以及一台共享储设备,可采用共享存储双机热备方案,对应双机热备软件产品为ServHA Cluster。

   若用户已经拥有两台服务器以及两台共享储设备,可采用双机双柜双机热备方案,对应双机热备软件产品为ServHA DS Mirror。

                                (参考北京微彩华创科技有限公司ServHA系列软件)                                 http://www.microcolor.cn/products/index.html

 

现提供另外两款同行软件产品供参考:

二、RoseMirrorHA软件产品镜像双机热备方案(与上述方案一一致):

1.RoseMirrorHA产品介绍

    RoseMirrorHA是基于数据实时镜像和共享磁盘的双机高可用解决方案。用户可以在原单机服务器基础上,增加一台服务器,或增加一台服务器及一台磁盘阵列,即可实现灵活的双机高可用系统。

         

2.RoseMirrorHA工作原理

  传统高可用性系统中必须通过共享存储来实现数据的一致性和连续性,这个特性无形中增加了可用性系统的成本。RoseMirrorHA基于以太网络TCP/IP协议,通过数据实时镜像技术,在两台主机之间实现不需要共享存储的纯软高可用系统,同时也可以实现配合使用共享存储的高可用系统。如此灵活的双机高可用系统配置方式,用户可以在充分利用已有资源的基础上,根据自己的实际硬件环境来选择。
  RoseMirrorHA高可用性系统,可以对主机的IP、应用程序、数据等进行监控和保护,当应用程序或主机发生故障后,RoseMirrorHA将自动、快速地将应用切换到备机,确保应用服务的持续性和可用性,保证公司业务的持续运行。
  RoseMirrorHA支持Active/Standby和Active/Active两种模式。在Active/Standby方式中,其中一台主机作为Active主机,运行重要的应用程序,向客户端提供各种应用服务,另一台主机作为备机也叫standby 主机,实时监控Active主机运行情况,当Active主机发生故障后,备机就接管Active主机上的应用服务。在Active/Active配置方式中,每台主机上运行各自的应用程序。服务器在运行自身的应用服务时,同时也作为另一台主机的备机,即两台主机互为对方的备机。
  RoseMirrorHA通过网络在两台主机之间进行实时的数据镜像。当Active主机发生故障时,RoseMirrorHA将自动将应用服务切换到备机。并在备机镜像数据的基础上,继续为客户端提供业务服务。

3.RoseMirrorHA主要功能特点:

● 无缝集成到既有系统环境
  RoseMirrorHA支持客户既有的环境,充分利用客户既有的资源。充分保护用户投资,保护用户既有的应用和数据。最大限度地适应已有的软件和硬件环境。
  高效成熟的多种镜像方式:支持完全镜像、差分镜像
  完全镜像:将Active主机的数据无条件重新传输到Standby主机,不论Standby主机是否已经存在该文件。可以确保数据的完整和一致性。通常在初始化的时候,需要采用完全镜像的方式。
  差分镜像:只传输Standby与Active不同的部分,而不必传送相同部分的数据,可以减少对网络等资源的使用,提高数据镜像的效率。
  按需复制性能资源最佳化
  RoseMirrorHA支持复制数据集的定义,用户可以选择定制需要复制的目录、文件。RoseMirrorHA的数据镜像是基于文件系统之上的,仅仅复制文件变化的部分。RoseMirrorHA通过自身的驱动程序来监控用户指定数据集,获取变化内容进行传输处理。这种以字节为单位的按需复制,充分保证了系统性能和效率的最佳化。
● 支持在线备份数据或维护 
  支持目标写入暂停
  当需要对备机上复制的数据进行备份、查看的操作,不希望新的数据写入时,可以使备机暂停写入,暂停后数据仍将发送到备机,备机将暂停后的数据缓存起来。备机完成数据操作后,再将缓存的数据写入到数据集中,恢复正常操作状态。
  支持Active主机传输暂停
  RoseMirrorHA允许对Active主机复制的数据暂停发送,暂停后变化的数据仍然将被获取,变化的数据将被存入pagefile,等待传输暂停恢复后发送。
  消除备份窗口
  通过备机写入暂停或主机传输暂停,可以在确保主机应用在线持续运行的情况下,通过备机将数据备份到其他存储设备。既保证了业务的持续运行,性能不受影响,同时又可以对数据进行更多方式,更加灵活的备份保护。同时备份操作的作业时间也有了更大的灵活性,不必等到晚上或是周末再进行。
● 支持快照功能
  完善的数据容灾机制,支持计划或手动创建快照。既可以使用实时镜像的最新数据,也可以使用历史时间点上的快照数据。
● 智能的故障处理恢复机制
  支持pagefile机制
   当网络故障、传输暂停等情况下,数据无法发送时,RoseMirrorHA将数据暂存在pagefile中,当可以发送后继续进行发送,保证数据不会丢失。pagefile的大小可以自行设定。
  智能的数据传输
  当网络发生故障后,RoseMirrorHA的数据复制不会停止,而是将复制的数据放入pagefile中,当网络恢复后将自动地将pagefile中的数据发送到备机,而不需要重新进行同步,有效地减少了网络和CPU的负担。
  支持磁盘空间监控
  RoseMirrorHA提供磁盘空间监控功能,当磁盘的可用空间低于设定值时,将通过邮件、在线消息进行报警。
  多样化的报警方式
  RoseMirrorHA针对各种意外提供了多种报警方式,如:在线日志,邮件通知,短信通知,SNMP协议通知等,以便管理员及时监控管理集群。
● 完整的数据属性复制支持
  支持Windows 多数据流
  RoseMirrorHA支持Windows多数据流的复制。
  支持ACL
  RoseMirrorHA支持Window Access Control List(ACL)的复制。
● 自动的应用高可用性保护
  支持IPV4,IPV6网络通信协议
  RoseMirrorHA支持IPV4网络通信协议以及未来适用的IPV6网络通信协议。
  支持虚拟MAC地址
  在网络环境中,每个IP与唯一的MAC绑定在一起。而传统的集群结构下,将致使集群的活动IP在不同时刻绑定不同的MAC地址,导致跨网段通信出问题。为了集群软件更好的支持这种网络安全级别较高的网络环境,Rose集群软件提供了支持虚拟MAC地址的功能,使集群环境IP地址实现与唯一MAC地址绑定。
  支持单个JOB配置多个活动IP
  支持在同一JOB中,多片物理网卡上绑定不同的活动IP,适应同一应用同时提供不同网段(内网/外网)的服务。
  支持Windows主机别名
  RoseMirrorHA中每个被保护的应用都可以建立多个主机别名,客户端可以通过别名访问应用服务。
  支持应用进程的监控
  RoseMirrorHA可以监控标准的Windows服务和Linux平台的应用,同时支持以自定义方式对用户自己的应用进程进行监控。
  支持网卡、活动IP的监控
  RoseMirrorHA将对主机的网卡、活动IP的状态进行监控,当发生故障时通过在线消息等进行通知。
  支持多条心跳
  RoseMirrorHA支持Socket和RS232两种类型的心跳,并支持心跳冗余,最多允许三条心跳。当配置远距离的高可用性系统时,使用网卡类型的心跳。
  增强数据安全策略
  RoseMirrorHA提供灵活的数据切换策略,在不同的应用环境中使用不同的切换策略,比如:数据完全一致切换、数据差异切换、应用优先切换等,对数据的可用状态进行监控,充分保证切换后的数据状态是有效的,是可用的。
  RoseMirrorHA完整的高可用性保护策略,在主机发生故障时,可以及时自动的将应用服务切换到备机,确保业务的迅速恢复。 
  应用资源的动态增删
  在不影响已有应用资源的运行状态下,支持动态增加应用资源,支持动态删除部分已有的应用资源。
● 简洁直观的管理工具
  RoseMirrorHA简洁直观的图形化管理工具(GUI),可以在网络中的任何一个地方管理网络中的RoseMirrorHA主机,实现了远程管理。RoseMirrorHA简洁易用的配置管理方式,大大降低了系统的实施管理和维护成本。
● 体贴的应用配置向导支持
  优秀的应用配置向导支持,简化了配置工作的难度。通过配置向导,只需根据向导的提示即可轻松地建立应用服务。RoseMirrorHA的配置向导中提供了许多常见应用(如:Oracle、MS SQL、Exchange等)的配置模板,用户可以很方便地使用向导进行配置,实现应用程序的实时数据复制和高可用性。
集群关机工具:
  提供集群环境下的关机工具,一键关闭集群所有主机,方便用户维护管理集群。 
备份和恢复集群配置:
  支持集群配置的快速备份;并且在相同的应用环境下,可通过向导批量恢复集群配置。
在线升级:
  集群软件可支持在线升级,在不影响应用资源运行的情况下,在线升级集群软件。

 

该解决方案优点:
1.对服务器硬件配置要求不高,可以根据应用情况采用不同型号或配置。
2.系统切换时间短,最大程度减少业务中断的影响。
3.切换过程对应用程序无影响,无需重新启动或登录,做到无人值守。
4.不需要磁盘阵列,具有较高的性能价格比。
5.高效成熟的多种镜像方式,支持完全镜像、差分镜像。
6.最佳化的按需复制,支持自定义复制数据集。RoseMirrorHA的数据镜像是基于文件系统  之上的以字节为单位的按需复制,充分保证了系统性能和效率的最佳化。
7.消除备份窗口。备份时可以使备机写入暂停或主机传输暂停,在主机应用在线持续运行的    情况下,通过备机对数据进行备份操作。
8.支持丰富的应用配置,譬如:Oracle、MSSQL Server、Sybase、MySQL 等。
9.简洁直观的管理工具,体贴的应用配置向导支持,便于维护管理。

产品规格:

 

                                                    (具体参考雷克泰安公司)

                           http://www.leiansoft.com/product/detail/438.html

 

三、pluswell双机热备软件产品镜像双机热备方案(与上述方案一一致):

接口服务器主备方案

接口服务器采用主、备冗余设置。主、备服务器同时工作,主、备之间会周期性循环发送相互检测的测试包,以检测主、备服务器工作状态。

主备双机结构图

       

                图1接口服务器主备双机结构图

实现说明

  主备接口服务器通过pluswell双机热备软件实现双机热备功能。双机热备软件能对计算机的操作系统、网络系统和数据库及时进行检测,当其中任何一个系统出现问题时该双机软件能自动运行到备用服务器上,让备用服务器接管主机的工作,达到让计算机永不停机,数据永不丢失。

1)  主备实现选用两套接口服务器,一套主接口服务器,另外一套备接口服务器。

2)  主接口服务器为业务正常时的服务器,备接口服务器为主服务器发生故障,切换时的服务器。

工作原理

1)  心跳工作过程

  通过IP做心跳检测时,主备双机会通过心跳路径(TCP/IP协议),周期性的发出相互检测的测试包。在系统正常情况下,主用服务器为系统提供服务,备份服务器监视工作机的运行情况(主用服务器同时也在检测备份服务器是否正常)。如果主机出现故障,备机接收到连续丢失的最大丢失数量的检测包后,会认为主用服务器出现故障。这时备用服务器会自动检测设置中是否有第二种心跳,如果没有第二种心跳的话,备机则根据已设定的规则,主动接管主用服务器的工作,继续支持信息的服务,保证系统不间断的运行。同时,在主用服务器出现故障时,网管系统会显示主用服务器故障告警提示。

       

              图主备双机心跳工作

2)  IP工作过程

  IP地址采用虚拟IP地址的方法来实现,主要原理如图:

         

  主机正常的情况下虚拟IP地址指向主机的实IP地址,用户通过虚拟IP地址访问主机,这时软件将虚拟IP地址解析到主机实IP地址。

  当主机做相关的切换时:

         

  虚拟IP地址通过软件自动将虚拟IP地址解析到备机的实IP地址上,这时,虚拟IP地址指向备机的实IP地址。但对用户来说,用户访问的仍然是虚拟IP地址。所以用户只会在切换的过程中发现有短暂的通信中断,经过一个短暂的时间,就可以恢复通信。

3)  应用及网络故障切换过程

l  可以检测到操作系统的故障并及时将服务切到备用服务器

         

l  可以检测到数据库的故障并及时将服务切到备用服务器

        

l  当操作系统和数据库系统正常,可以检测服务器网络的故障并及时将服务切到备用服务器

        

 

其他说明:

  蓝科泰达公司凭借其丰富的研发经验,可提供高可用性系列产品和优质的服务,推出了蓝科泰达双机容错打包解决方案,目的在于保证数据永不丢失和系统永不停顿,同时为用户节省大量的开支。

  蓝科泰达容错系统结合了蓝科泰达磁盘阵列产品的安全可靠性与双机容错技术高可用性的优点,相互配合二者的优势。蓝科泰达磁盘阵列针对双机容错技术做了许多优化和改进,满足了双机硬件的连接要求,根据应用环境的实际情况,适用于Windows2000平台以上,开放源代码Linux平台,SCO UNIX平台上的多种双机热备软件。

蓝科泰达提供的打包方案(一)主要包括以下热备份设备:

*双机软件   PlusWell HA         一套

*文件同步   PlusWell Mirror     一套

  企业关键业务一旦中断,企业的日常运作将受到致命的影响,那么就要求我们的系统在最短的时间内将系统恢复到正常状态。

所以我们要求双机软件能够实现以下几点:

1、 异常终端检测

2、 网络故障,系统故障,应用程序故障等全系统检测

3、 当高可用系统中的某个节点故障,无须人工干预自动切换,保障系统运行

4、 速度快(快速恢复)

    贵单位业务平台,是以Windwos 2003 Server系统平台为基础,以SQL Server为核心的数据库的协同办公平台,该系统对稳定性要求很高、系统实时性和可用性提出要有连续运行的能力,系统一旦出现故障,其损失是惨重的。

    因此,建议用户采用高可用技术,高可用系统在各个节点间保持的间歇的通讯,使系统中的独立节点组合成整体的一套系统,并使用PlusWell 软件可以保障该系统中的某一节点故障都可被PlusWell 软件所监控,如主服务器应用程序、网卡、操作系统,均纳入公共的安全体系,确保7*24的不停机。

 

                                            (具体参考蓝科泰达科技有限公司)

                                    http://www.pluswell.com.cn/Item/52.aspx

分类:

技术点:

相关文章: