在流量入负载均衡之前，还有一道网络分发的过程：

它们会从 DNS 解析开始，通过域名 -> “CNAME” -> “负载调度服务” -> “就近的数据中心入口” 的路径，比如根据 IP 地址将请求用户分配到一个合适的数据中心，然后请求流量就到了我们马上要说的负载均衡器

负载均衡器主要有两种形式，一种是四层负载均衡，另一种是七层负载均衡。

四层负载均衡是性能高，但是局限性很多。

七层负载均衡是功能强大，拓展性非常高

四层负载均衡

这里面又分为多种负载均衡器，大部分都是工作在第二、三层数据链路层。

二层数据链路负载均衡

基于数据链路负载均衡器传输的数据内容是数据帧（Frame），如以太网帧、ADSL 宽带的 PPP 帧等。它可以改写机器 MAC 地址。事实上，数据链路层负载均衡工作原理就是改写请求的数据帧上的 MAC 目标地址，转发到一个新的 MAC 目标地址并重新包装到数据帧中。

第二层的数据帧经第三层网络的 TCP 包装，因为第二层是不涉及到第三层数据包目标 IP 地址和源 IP 地址的更改。所以到了第三层的数据包，也就是 IP 数据包中，包含了源（客户端）和目标（均衡器）的 IP 地址，只有真实服务器保证自己的 IP 地址与数据包中的目标 IP 地址一致，这个数据包才能被正确处理。

所以，我们在使用这种负载均衡模式的时候，需要把真实物理服务器集群所有机器的虚拟 IP 地址（Virtual IP Address，VIP），配置成跟负载均衡器的虚拟 IP 一样，这样经均衡器转发后的数据包，就能在真实服务器中顺利地使用。

因为在处理过程中真实服务器的 IP 和数据请求中的目标 IP 地址一样，所以响应结果就不需要经过负载均衡器进行地址交换了，而是直接将响应数据包转发给目标客户端，避免了负载均衡器称为了性能瓶颈。所以性能是非常高的。

这也注定了使用场景，因为二层负载均衡器直接改写目标 MAC 地址的工作原理，决定了它与真实服务器的通讯必须是二层可达的。通俗地说，就是它们必须位于同一个子网当中，无法跨 VLAN。

因此，数据链路层负载均衡最适合用来做数据中心的第一级均衡设备，用来连接其他的下级负载均衡器。

三层网络层负载均衡

第三层是网络层，与二层数据链路负载均衡器修改 MAC 工作原理类似，只是这里改成修改数据包（Package）的目标 IP 地址。这里面就涉及到了 “IP 隧道” 的工作原理了，大概原理是负载均衡器将原来的数据包的请求头 Headers 和负载数据（Payload）封装成另一个新的数据包的 Payload 转发给真实服务器，这也就意味着服务器必须要针对这个 “IP 隧道” 进行解析拆包，所以这里面会有性能损失，并且也不是所有系统都支持这个 IP 隧道协议的。

还有一种方式是直接更改 Header 中的目标 IP 地址将原来属负载均衡器的地址更改为真实服务器的 IP 地址。但是由于在做应答请求时，由于源地址已经改为真是服务器地址，所以用户客户端无法识别，所以无法做出正确的回应。这个时候就要借助 “NAT” 来做转换了。因为又引入了一个中间件，所以在流量大的情况，这部分也会称为性能瓶颈

应用层负载均衡

前面提到的负载均衡器都是做的转发，而到了应用层就无法做到转发了，只能通过代理，此时客户端与负载均衡器和真实服务器是通过两条独立的 TCP 通道建立连接的。

代理又分为三种：

正向代理，也就是对服务器透明的，在客户端设置代理服务
反向代理，对客户端是透明的，在服务端设置代理服务
中间透明，对于两边都是透明的，在负载均衡器上做配置

所谓代理即所有请求与响应都要经过负载均衡器来协调。虽然性能最低但是能做出更多的拓展，缓存，安全，限流等

负载均衡算法实现

随机负载均衡（Random）：把客户端的请求随机分配给内部的多个服务器。
权重随机均衡（Weighted Random）：这种均衡算法类似于权重轮循算法，不过在处理请求分担的时候，它是个随机选择的过程。
轮询负载均衡（Round Robin）：每次网络请求会轮流分配给内部的服务器，从 1 到 N 然后又重新开始分配。这种均衡算法适用于服务器组中的所有服务器都有相同的软硬件配置，并且平均服务请求相对均衡的情况。
权重轮循均衡（Weighted Round Robin）：根据服务器的硬件能力不同，给每个服务器分配不同的权值，根据这个权值来动态分配请求。如服务器 A 的权值为 3，服务器 B 的权值为 5，C 的权值为 2；那么这三个服务器分别能接收请求量的 30%、50% 和 20%。
一致性哈希均衡（Consistency Hash）：根据请求中的某些特性值（如 IP，MAC 地址等）计算出 hash 值来分配到不同的服务器，只要特性值相同，hash 出来的值一定相同。如果对应的服务器出问题，也之影响这个服务器的 hash，其它不受影响。
响应速度均衡（Response Time）：负载均衡设备对内部各服务器发出一个探测请求（如 Ping），然后根据内部中各服务器对探测请求的最快响应时间，来决定哪一台服务器来响应客户端的服务请求。
最小连接负载均衡（Least Connection）：客户端的每一次请求服务，在服务器停留的时间可能会有比较大的差异。那么随着工作时间加长，如果采用简单的轮循或者随机均衡算法，每一台服务器上的连接进程可能会产生极大的不平衡，并没有达到真正的负载均衡。所以，最少连接数均衡算法就会对内部中需要负载的每一台服务器，都有一个数据记录，也就是记录当前该服务器正在处理的连接数量，当有新的服务连接请求时，就把当前请求分配给连接数最少的服务器，使均衡更加符合实际情况，负载也能更加均衡。这种均衡算法适合长时间处理的请求服务，比如 FTP 传输
- 加权比例选择
- p2c 负载均衡（两种选其一）

参考资料

https://time.geekbang.org/column/article/327417
https://zhuanlan.zhihu.com/p/146848111

MS.Microservice