高可用集群下的负载均衡相关概念（LVS）

【1】负载均衡

- 负载均衡（Load Balance)是集群技术（Cluster）的一种应用。指将负载（工作任务）进行平衡、分摊到多个单元操作上进行运行，从而提高并发处理能力。
- 作用：
[1] 解决并发压力，提高应用处理性能（增加吞吐量，加强网络处理能力）
[2] 提供故障转移，实现高可用。
[3] 通过添加或者减少服务器数量，提供网站伸缩性（扩展性）。
[4] 安全防护

【2】服务器集群（Cluster）

使得多个服务器节点能够协同工作，根据目的的不同，服务器集群可以分为：
[1] 高性能集群：将单个重负载的请求分散到多个节点进行处理，最后在将处理结果进行汇总。
[2] 高可用集群：提高冗余单元，避免单点故障。
[3] 负载均衡集群：将大量的并发请求分担到多个处理节点。由于单个处理节点的故障不影响整个服务器，负载均衡集群同时也实现了高可用。

【3】 LVS（Linux Virtual Server,linux虚拟服务器）。基于不同的网络技术，LVS支持多种负载均衡机制，包括i：VS/NAT（基于网络地址转换技术）、VS/TUN（基于IP隧道技术）、VS/DR（基于直接路由技术）。
不管使用哪种技术，LVS都不直接处理请求，而是将请求转发到后面真正的服务器（Real Server）。不同的机制，决定了相应包如何返回到客户端。

【4】LVS工作的基本原理

- 当用户向负载均衡调度器（Director Server）发起请求，调度器将请求发往至内核空间
- PREROUTING链首先会接收到用户请求，判断目标IP确定是本机IP，将数据包发往INPUT链
- IPVS是工作在INPUT链上的，当用户请求到达INPUT时，IPVS会将用户请求和自己已定义好的集群服务进行比对，如果用户请求的就是定义的集群服务，那么此时IPVS会强行修改数据包里的目标IP地址及端口，并将新的数据包发往POSTROUTING链
- POSTROUTING链接收数据包后发现目标IP地址刚好是自己的后端服务器，那么此时通过选路，将数据包最终发送给后端的服务器

【5】LVS的组成

LVS 由2部分程序组成，包括 ipvs 和 ipvsadm。
- ipvs(ip virtual server)：一段代码工作在内核空间，叫ipvs，是真正生效实现调度的代码。
- pvsadm：另外一段是工作在用户空间，叫ipvsadm，负责为ipvs内核框架编写规则，定义谁是集群服务，而谁是后端真实的服务器(Real Server)

【6】相关术语

-   DS：Director Server。指的是前端负载均衡器节点。
- RS：Real Server。后端真实的工作服务器。
-    VIP：Virtual IP 向外部直接面向用户请求，作为用户请求的目标的IP地址。
-   DIP：Director Server IP，主要用于和内部主机通讯的IP地址。
-   RIP：Real Server IP，后端服务器的IP地址。
-     CIP：Client IP，访问客户端的IP地址。
-   VS : Virtual server

【7】LVS三种年模式的详解

- NAT模式（重点理解NAT方式的实现原理和数据包的改变。）

高可用集群下的负载均衡相关概念（LVS）

NAT（Network Address Translation）即网络地址转换，其作用是通过数据报头的修改，使得位于企业内部的私有IP地址可以访问外网，以及外部用用户可以访问位于公司内部的私有IP主机。负载调度器可以使用两块网卡配置不同的IP地址，eth0设置为私钥IP与内部网络通过交换设备相互连接，eth1设备为外网IP与外部网络联通。

第一步，用户通过互联网DNS服务器解析到公司负载均衡设备上面的外网地址，相对于真实服务器而言，LVS外网IP又称VIP（Virtual IP Address），用户通过访问VIP，即可连接后端的真实服务器（Real Server），而这一切对用户而言都是透明的，用户以为自己访问的就是真实服务器，但他并不知道自己访问的VIP仅仅是一个调度器，也不清楚后端的真实服务器到底在哪里、有多少真实服务器。

第二步，用户将请求发送至172.25.60.1，此时LVS将根据预设的算法选择后端的一台真实服务器，将数据请求包转发给真实服务器，并且在转发之前LVS会修改数据包中的目标地址以及目标端口，目标地址与目标端口将被修改为选出的真实服务器IP地址以及相应的端口。

第三步，真实的服务器将响应数据包返回给LVS调度器，调度器在得到响应的数据包后会将源地址和源端口修改为VIP及调度器相应的端口，修改完成后，由调度器将响应数据包发送回终端用户，另外，由于LVS调度器有一个连接Hash表，该表中会记录连接请求及转发信息，当同一个连接的下一个数据包发送给调度器时，从该Hash表中可以直接找到之前的连接记录，并根据记录信息选出相同的真实服务器及端口信息。

- LVS-NAT模式

1.客户端将访问vip报文发送给LVS服务器；
2.LVS服务器将请求报文的目的地址修改为后端真实服务器(DNAT)，发送给后端真实服务器；
3.后端服务器在处理完之后要将响应的报文返回给客户端，但是却不在同一网段；
4.LVS根据自己的追踪技术将后端真实服务响应客户端的报文原地址改为自己的ip地址(SNAT)，发送给客户端。

- DR模式

DR模式也叫直接路由模式，其体系结构如图所示，该模式中LVS依然仅承担数据的入站请求以及根据算法选出合理的真实服务器，最终由后端真实服务器负责将响应数据包发送返回给客户端。与隧道模式不同的是，直接路由模式（DR模式）要求调度器与后端服务器必须在同一个局域网内，VIP地址需要在调度器与后端所有的服务器间共享，因为最终的真实服务器给客户端回应数据包时需要设置源IP为VIP地址，目标IP为客户端IP，这样客户端访问的是调度器的VIP地址，回应的源地址也依然是该VIP地址（真实服务器上的VIP），客户端是感觉不到后端服务器存在的。由于多台计算机都设置了同样一个VIP地址，所以在直接路由模式中要求调度器的VIP地址是对外可见的，客户端需要将请求数据包发送到调度器主机，而所有的真实服务器的VIP地址必须配置在Non-ARP的网络设备上，也就是该网络设备并不会向外广播自己的MAC及对应的IP地址，真实服务器的VIP对外界是不可见的，但真实服务器却可以接受目标地址VIP的网络请求，并在回应数据包时将源地址设置为该VIP地址。调度器根据算法在选出真实服务器后，在不修改数据报文的情况下，将数据帧的MAC地址修改为选出的真实服务器的MAC地址，通过交换机将该数据帧发给真实服务器。整个过程中，真实服务器的VIP不需要对外界可见。

- TUN模式

在LVS（NAT）模式的集群环境中，由于所有的数据请求及响应的数据包都需要经过LVS调度器转发，如果后端服务器的数量大于10台，则调度器就会成为整个集群环境的瓶颈。我们知道，数据请求包往往远小于响应数据包的大小。因为响应数据包中包含有客户需要的具体数据，所以LVS（TUN）的思路就是将请求与响应数据分离，让调度器仅处理数据请求，而让真实服务器响应数据包直接返回给客户端。VS/TUN工作模式拓扑结构如图3所示。其中，IP隧道（IP tunning）是一种数据包封装技术，它可以将原始数据包封装并添加新的包头（内容包括新的源地址及端口、目标地址及端口），从而实现将一个目标为调度器的VIP地址的数据包封装，通过隧道转发给后端的真实服务器（Real Server），通过将客户端发往调度器的原始数据包封装，并在其基础上添加新的数据包头（修改目标地址为调度器选择出来的真实服务器的IP地址及对应端口），LVS（TUN）模式要求真实服务器可以直接与外部网络连接，真实服务器在收到请求数据包后直接给客户端主机响应数据。

【7】三种方法的有缺点比较：

[1] VS/NAT

- 优点：对后端服务器的操作系统无要求，只需要一个IP地址配置在调度器上，服务器组可以用私有的IP地址。支持端口映射。
- 缺点：请求和相应报文都需要通过调度器，伸缩能力有限。要求服务器和调度器在同一个VLAN。需要将服务器的调度网关指向调度器。对于那些将IP地址或者端口号在报文数据中传送的网络服务，需要编写相应的应用模块来转换报文数据中的IP地址或者端口号。

[2] VS/TUN

- 优点：不需要调度应答报文，性能高。服务器和调度器可以不在同一个VLAN。支持广域负载均衡。
- 缺点：所有的服务必须支持“IP Tunneling”协议，要安装内核模块，配置复杂。有建立IP隧道的开销。服务器上直接绑定虚拟IP，风险很大。不支持端口映射。

[3] VS/DR

- 优点：与VS/TUN相比，没有IP隧道的开销，性能最好。
- 缺点：要求调度器与服务器都有一块网卡连在同一物理网段（同一VLAN）上。要求服务器网路i设备不做ARP响应，或者能将报文重定向到本地的Socket端口上。服务器上直接绑定虚拟IP，风险很大。不支持端口映射。