1.Nginx的产生
Nginx同Apache一样都是一种Web服务器。基于REST架构风格,以统一资源描述符URI或者统一资源定位符URL作为沟通依据,通过HTTP协议提供各种网络服务。然而这些服务器在设计之初受到当时环境的局限,例如当时的用户规模,网络带宽,产品特点等局限并且各自定位和发展都不尽相同。这也使得各个Web服务器有着各自鲜明的特点。Apache的发展时期很长,而且是毫无争议的世界第一服务器。它有很多优点:稳定、开源、跨平台等等。
但它是一个重量级的,并且不支持高并发,在Apache上运行数以万计的并发访问,会导致服务器消耗大量内存。操作系统对其进行进程或线程间的切换也消耗了大量的CPU资源,导致HTTP请求的平均响应时间提高。这些都决定了Apache不可能成为高性能Web服务器,轻量级高并发服务器Nginx就应运而生。俄罗斯的工程师Igor Sysoev,他在为Rambler Media工作期间,使用C语言开发了Nginx。
Nginx作为Web服务器一直为Rambler Media提供出色而又稳定的服务。Igor Sysoev将Nginx代码开源,并且赋予自由软件许可证。
下面几点是Nginx流行的主要原因
- Nginx使用基于事件驱动架构,使得其可以支持以百万级别的TCP连接。
- 高度的模块化和自由软件许可证使得第三方模块层出不穷。
- Nginx是一个跨平台服务器,可以运行在Linux、Windows、FreeBSD、Mac OS 等操作系统上。
- 优秀的设计带来的极大的稳定性。
下面是几种Web服务器的对比:
2. Nginx基本概念
Nginx是一款轻量级的Web服务器、反向代理服务器,由于它的内存占用少(一个worker进程只占用10-12M内存),启动非常快,高并发能力强,在互联网项目中被广泛应用。上图基本说明了当下流行的技术架构,其中Nginx有点像SpringCloud中的入口网关。
3.反向代理服务器
写反向代理之前先要了解一下什么是正向代理。
正向代理
由于防火墙的原因,我们并不能直接访问谷歌,那么我们可以借助其他工具来实现,这就是一个简单的正向代理的例子。正向代理代理的是客户端,而且客户端是知道目标的,而目标是不知道客户端是通过代理工具访问的。
正向代理的用途
- 访问原来无法访问的资源,如Google.
- 可以做缓存,加速访问资源。
- 对客户端访问授权,上网进行访问。
- 代理可以记录用户的访问记录,对外隐藏用户信息。
反向代理
当我们在外网访问百度的时候,其实会进行一个转发,代理到内网去,这就是所谓的反向代理,代理的是服务器端,而且这一个过程对于客户端而言是透明的。
反向代理的作用
- 保证内网的安全,通常将反向代理作为公网访问地址,Web服务器是内网。
- 负载均衡,通过反向代理服务器来优化网站的负载。
项目场景
通常情况下,我们在实际项目操作时,正向代理与反向代理很有可能会存在一个应用场景中,正向代理代理客户端的请求去访问目标服务器,目标服务器是一个反向单利服务器,反向代理了多台真实的业务处理服务器。
4.Nginx中的Master-Worker模式
要启动nginx,只需要输入nginx命令,然后通过ps aux|grep nginx可以看到下面的内容启动Nginx后,其实就是在80端口启动了Socket服务进行监听,如图所示,Nginx涉及Master进程和Worker进程。
Master进程的作用:读取并验证配置文件nginx.conf,管理worker进程。
Worker进程的作用:每一个Worker进程都维护一个线程(避免线程之间的切换),处理请求和连接,一般和CPU个数有关,配置几个就有几个Worker进程,上面的例子只有一个Worker进程。
Nginx负载均衡
概念
Nginx反向代理服务器收到的请求数量,就是负载量。请求数量按照一定的规则进行分发,到不同的服务器处理的规则,就是一种均衡规则。
所以将服务器接收到的请求按照规则分发的过程称为负载均衡。
负载均衡在项目操作过程中又分为硬件负载均衡与软件负载均衡两种,硬件负载均衡也称为硬负载。如F5负载均衡,相对造价昂贵成本较高。
但是数据的稳定性安全性等等有很好的保证。
Nginx支持的负载均衡调度算法方式如下
- 1.weight轮询(默认):接收到的请求按照顺序逐一分配到不同的后端服务器,即使在使用过程中,某一后端服务器宕机,Nginx会自动将该服务器剔除出队列,请求受理情况不会受到影响。
这种方式下,可以给不同的后端服务器设置一个权重,用于调整不同的服务器上请求的分配率。
权重数据越大,被分配到的请求几率越大;该权重值,主要是针对实际工作环境中不同的后端服务器硬件配置进行调整的。 - 2.ip_hash:每个请求按照发起客户端的ip的hash值结果进行匹配,这样的算法下一个固定的ip地址的客户端总会访问到同一个后端服务器,这在一定程度上解决了集群部署环境下Session共享的问题。
- 3.fair:智能调整调度算法,动态的根据后端服务器的请求处理到响应时间进行均衡分配。
响应时间短处理效率高的服务器分配到请求的概率高,响应时间长处理效率低的服务器分配到的请求少,它是结合了前两者的优点的一种调度算法。
但是需要注意的是Nginx默认不支持fair算法,如果要使用这种调度算法,请安装upstream_fair模块。 - 4.url_hash:按照访问的URL的hash结果进行分配请求,每个请求的URL会指向后端固定的某个服务器,可以在Nginx作为静态服务器的情况下提高缓存效率。
同样要注意Nginx默认不支持这种调度算法,要使用的话需要安装Nginx的hash软件包。