文章目录
前言
负载均衡
将高并发、高流量的网络请求,经过负载均衡,动态转发给后端多个节点处理,以提高响应效率、提高吞吐量。
一、网络原理
负载均衡建立在现有网络结构之上,它提供了一种廉价有效透明的方法扩展网络设备和服务器的带宽、增加吞吐量、加强网络数据处理能力、提高网络的灵活性和可用性。
负载均衡(Load Balance)其意思就是分摊到多个操作单元上进行执行,例如Web服务器、FTP服务器、企业关键应用服务器和其它关键任务服务器等,从而共同完成工作任务。
1.负载均衡的优点
- 减伤公网IP数量,节省IP支出成本
- 异常内部服务器IP,提高内部服务器安全性
- 解决单机故障问题,提供高并发下高可用的策略
- 在用户无感知情况下,做WEB服务器的动态水平拓展
- 支持四层和七层负载,对四层性能更好,支持服务器的动态上下线
- 性能强,并发数可达数万至数十万
- 配置简单,有固定格式的配置文件
2.四层和七层负载均衡
这里的四层和七层是指的OSI七层网络模型。OSI网络模型是从上往下的,越底层越接近硬件,越往上越接近软件。这七层模型分别是物理层、数据链路层、网络层、传输层、会话层、表示层、应用层。

四层负载均衡:基于IP+端口的负载均衡:从传输层(TCP)开始是,使用“ip + port”接受请求,再转发到对应的服务器。TCP三次握手是直接和后端连接的。只不过在后端机器上看到的都是与代理机的IP的established而已,LVS中没有握手。
七层负载均衡:基于虚拟的URL或主机IP的负载均衡,在四层负载均衡的基础上,通过应用层协议实现负载均衡。7层代理则必须要先和代理机三次握手后,才能得到7层(HTT层)的具体内容,然后再转发。意思就是代理机必须要与client和后端的机器都要建立连接。显然性能不行,但胜在于七层,人工可操作性高,能写更多的转发规则。
3.常见的负载均衡软硬件
当前服务器集群的负载均衡主要分为:硬件负载均衡和软件负载均衡。
硬件负载均衡主要有:F5、Array、NetScaler等
软件负载均衡主要有:LVS、HAProxy、Nginx等
二、硬件负载均衡
解决方案是直接在服务器和外部网络间安装负载均衡设备,这种设备我们通常称之为负载均衡器。由于使用专门的设备完成网络请求转发的任务,独立于操作系统,整体性能高,负载均衡策略多样化,流量管理智能化。
优点
-
其功能强大,不仅包含负载均衡还包括应用交换、会话交换、状态监控、智能网络地址转换、通用持续性、响应错误处理、IPv6网关、高级路由、智能端口镜像、SSL加速、智能HTTP压缩、TCP优化、第7层速率整形、内容缓冲、内容转换、连接加速、高速缓存、Cookie加密、选择性内容加密、应用攻击过滤、拒绝服务(DoS)攻击和SYN Flood保护、防火墙过滤等功能。
-
直接连接交换机,处理网络请求能力强,与系统无关,负载性可以强。可以应用于大量设施、适应大访问量、使用简单。
缺点
- 价格高昂、成本高,配置冗余.即使网络请求分发到服务器集群,负载均衡设施却是单点配置。
- 无法有效掌握服务器及应使用状态。
三、软件负载均衡
由于硬件负载均衡价格高昂,一般对于中小规模网站,使用软件负载均衡便可解决生产中所遇到的问题。
Nginx/LVS/HAProxy是目前使用最广泛的三种开源的负载均衡软件。一般对负载均衡的使用是随着网站规模的提升根据不同的阶段来使用不同的技术。
- 如果是中小型的Web应用,比如,日PV小于1000万,Web前端采用Nginx/HAProxy+Keepalived作负载均衡器;
- 如果服务器较多,可以用DNS轮询,LVS所耗费的机器还是比较多的。大型网站或重要的服务(Mysql),且服务器比较多时,可以考虑用LVS+Keepalived的架构。
三大主流软件负载均衡的适用场景:
-
网站建设初期,可以选用Nginx、HAProxy作为反向代理负载均衡(流量不大时,可以不选用负载均衡),因为其配置简单,性能也能满足一般业务场景。如果考虑到负载均衡器是有单点问题,可以采用Nginx+Keepalived/HAproxy+Keepalived避免负载均衡器自身的单点问题。
-
网站并发到达一定程度后,为了提高稳定性和转发效率,可以使用lvs,毕竟LVS比Nginx/HAProxy要更稳定,转发效率也更高。
四、LVS
LVS的是Linux Virtual Server的简写,翻译为Linux虚拟服务器,即一个虚拟的服务器集群系统,是由我国章文嵩博士在1998年5月所研究成立,也是中国国内最早出现的自由软件项目之一。主要有一下特点:
- 抗负载能力强,性能高,能达到F5的60%,对内存和CPU资源消耗比较低
- 稳定,可靠性高,自身有完美的热备方案(Keepalived+lvs)
- 配置性较低,这是缺点也是优点,因为没有可太多配置的东西,所以不需要人工介入,减少了人为出错几率
- 工作在网络4层,通过VRRP协议(仅作代理之用),具体的流量是由linux内核来处理,因此没有流量的产生
- 应用范围较广。因为LVS工作在4层,所以它几乎可以对所有应用做负载均衡,包括http、数据库、在线聊天室等等。
- 不支持正则处理,不能做动静分离
- 支持多种负载均衡算法:rr(轮询),wrr(带权轮询)、lc(最小连接)、wlc(带权最小连接)
- LVS工作模式有4种:
- nat 地址转换
- dr 直接路由
- tun 隧道
- full-nat
五、HAproxy
HAProxy是一个使用C语言编写的自由及开放源代码软件,它提供高可用性、负载均衡,以及基于TCP(第四层)和HTTP(第七层)的应用程序代理。HAProxy特别适用于那些负载特大的web站点,这些站点通常又需要会话保持或七层处理。
- 支持两种代理模式:TCP(四层)和HTTP(七层),支持虚拟主机
- 能够补充Nginx的一些缺点比如Session的保持,Cookie的引导等工作
- HAProxy跟LVS类似,本身只是一款负载均衡软件;单纯从效率上来讲HAProxy会比Nginx有更出色的负载均衡速度,在并发处理上也是优于Nginx的。
- 支持url检测后端的服务器出问题的检测会有很好的帮助
- 更多的负载均衡策略比如:动态加权轮循(Dynamic Round Robin),加权源地址哈希(Weighted Source Hash),加权URL哈希和加权参数哈希(Weighted Parameter Hash)已经实现
- 自带强大的监控服务器状态的页面,实际环境中我们结合Nagios进行邮件或短信报警
- 不支持POP/SMTP协议 SPDY协议
- 不能做Web服务器,即不支持HTTP cache功能
- 重载配置的功能需要重启进程,虽然也是soft restart,但没有Nginx的reaload更为平滑和友好
- 多进程模式支持不够好
六、Nginx
Nginx是一款轻量级的Web服务器/反向代理服务器及电子邮件(IMAP/POP3)代理服务器,在BSD-like 协议下发行。其特点是占有内存少,并发能力强。Nginx默认采用多进程工作方式,Nginx启动后,会运行一个master进程和多个worker进程。
-
工作在网络7层,可以针对http应用做一些分流的策略,比如针对域名,目录结构
-
注:1.10.X版本之后引入了对四层tcp转发的支持,默认:不开启
-
Nginx对网络的依赖较小,理论上能ping通就能进行负载功能
-
Nginx安装配置比较简单,测试起来很方便
-
也可以承担较高的负载压力且稳定,nginx是为解决c10k问题而诞生的
-
官方测试Nginx能够支撑5万并发连接,实际生产环境中可以支撑2~4万并发连接数。
-
对后端服务器的健康检查,只支持通过端口来检测,不支持通过url来检测
-
Nginx对请求的异步处理可以帮助节点服务器减轻负载压力
-
Nginx仅能支持http、https和Email协议,这样就在适用范围较小。
-
不支持Session的直接保持,但能通过ip_hash来解决。对Big request header的支持不是很好。
-
Nginx还能做Web服务器即Cache功能。
-
相较于HAproxy的重载配置的功能需要重启进程,Nginx则是支持热部署的。
七、Nginx特点
Nginx 专为性能优化而开发,性能是其最重要的要求,十分注重效率,有报告 Nginx 能支持高达 50000 个并发连接数。
1. 正向代理与反向代理
正向代理 :局域网中的电脑用户想要直接访问服务器是不可行的,服务器可能Hold不住,只能通过代理服务器来访问,这种代理服务就被称为正向代理,特点是客户端知道自己访问的是代理服务器。

反向代理 :客户端无法感知代理,因为客户端访问网络不需要配置,只要把请求发送到反向代理服务器,由反向代理服务器去选择目标服务器获取数据,然后再返回到客户端。
此时反向代理服务器和目标服务器对外就是一个服务器,暴露的是代理服务器地址,隐藏了真实服务器 IP 地址。

2.负载均衡
客户端发送多个请求到服务器,服务器处理请求,有一些可能要与数据库进行交互,服务器处理完毕之后,再将结果返回给客户端。
普通请求和响应过程如下图:

但是随着信息数量增长,访问量和数据量增长,单台的Server以及Database就成了系统的瓶颈,这种架构无法满足日益增长的需求,这时候要么提升单机的性能,要么增加服务器的数量。
关于提升性能,这儿就不赘述,提提如何增加服务器的数量,构建集群,将请求分发到各个服务器上,将原来请求集中到单个服务器的情况改为请求分发到多个服务器,也就是我们说的负载均衡。
图解负载均衡:

关于服务器如何拆分组建集群,这儿主要讲讲负载均衡,也就是图上的Proxy,可以是LVS,也可以是Nginx。假设有 15 个请求发送到代理服务器,那么由代理服务器根据服务器数量,这儿假如是平均分配,那么每个服务器处理 5 个请求,这个过程就叫做负载均衡。
3. 动静分离
为了加快网站的解析速度,可以把动态页面和静态页面交给不同的服务器来解析,加快解析的速度,降低由单个服务器的压力。
动静分离之前的状态

动静分离之后

在进行数据请求时,以淘宝购物为例,商品详情页有很多东西是动态的,随着登录人员的不同而改变,例如用户ID,用户头像,但是有些内容是静态的,例如商品详情页,那么我们可以通过CDN(全局负载均衡与CDN内容分发)将静态资源部署在用户较近的服务器中,用户数据信息安全性要更高,可以放在某处集中,这样相对于将说有数据放在一起,能分担主服务器的压力,也能加速商品详情页等内容传输速度。
八、Nginx的优势
1. 可操作性大
Nginx是一个应用层的程序,所以用户可操作性的空间大得多,可以作为网页静态服务器,支持Rewrite 重写规则;支持 GZIP 压缩,节省带宽;可以做缓存;可以针对 http 应用本身来做分流策略,静态分离,针对域名、目录结构等相比之下 LVS 并不具备这样的功能,所以 nginx 单凭这点可以利用的场合就远多于 LVS 了;但 nginx 有用的这些功能使其可调整度要高于 LVS,所以经常要去触碰,人为出现问题的几率也就大。
2. 网络依赖小
nginx对网络的依赖较小,理论上只要 ping 得通,网页访问正常,nginx 就能连得通,nginx 同时还能区分内外网,如果是同时拥有内外网的节点,就相当于单机拥有了备份线路;
LVS 就比较依赖于网络环境,目前来看服务器在同一网段内并且 LVS
使用 direct 方式分流,效果较能得到保证。另外注意,LVS 需要向托管商至少申请多于一个 ip 来做 visual ip。
3.安装简单
nginx 安装和配置比较简单,测试起来也很方便,因为它基本能把错误用日志打印出来。LVS 的安装和配置、测试就要花比较长的时间,因为同上所述,LVS 对网络依赖性比较大,很多时候不能配置成功都是因为网络问题而不是配置问题,出了问题要解决也相应的会麻烦的多
nginx也同样能承受很高负载且稳定,但负载度和稳定度差 LVS 还有几个等级:nginx 处理所有流量所以受限于机器 IO 和配置;本身的 bug 也还是难以避免的;nginx 没有现成的双机热备方案,所以跑在单机上还是风险比较大,单机上的事情全都很难说
4. 支持健康检查以及请求重发
nginx 可以检测到服务器内部的故障(健康检查),比如根据服务器处理网页返回的状态码、超时等等,并且会把返回错误的请求重新提交到另一个节点。
目前 LVS中 ldirectd 也能支持针对服务器内部的情况来监控,但 LVS 的原理使其不能重发请求。比如用户正在上传一个文件,而处理该上传的节点刚好在上传过程中出现故障,nginx 会把上传切到另一台服务器重新处理,而
LVS 就直接断掉了。
九、LVS 的优势
1. 抗负载能力强
因为 LVS 工作方式的逻辑是非常简单的,而且工作在网络的第 4 层,仅作请求分发用,没有流量,所以在效率上基本不需要太过考虑。LVS 一般很少出现故障,即使出现故障一般也是其他地方(如内存、CPU 等)出现问题导致 LVS 出现问题
2. 配置性低
这通常是一大劣势同时也是一大优势,因为没有太多的可配置的选项,所以除了增减服务器,并不需要经常去触碰它,大大减少了人为出错的几率
3. 工作稳定
因为其本身抗负载能力很强,所以稳定性高也是顺理成章的事,另外各种 LVS 都有完整的双机热备方案,所以一点不用担心均衡器本身会出什么问题,节点出现故障的话,LVS 会自动判别,所以系统整体是非常稳定的
4. 无流量
LVS 仅仅分发请求,而流量并不从它本身出去,所以可以利用它这点来做一些线路分流之用。没有流量同时也保住了均衡器的 IO 性能不会受到大流量的影响
LVS 基本上能支持所有应用,因为 LVS 工作在第 4 层,所以它可以对几乎所有应用做负载均衡,包括 http、数据库、聊天室等。
LVS是一个四层的负载均衡器,虽然是四层,但并没有TCP握手以及分手,只是偷窥了IP等信息,而Nginx是一个七层的负载均衡器,所以效率势必比四层的LVS低很多,但是可操作性比LVS高。
本文的引用仅限自我学习如有侵权,请联系作者删除。 参考知识
浅谈软件和硬件负载均衡(LVS、HAProxy、Nginx、F5)及一次线上问题分析
负载均衡 LVS vs Nginx 对比!

749

被折叠的 条评论
为什么被折叠?



