nginx + Keepalived组合解决单点故障与高可用:Nginx负责反向代理和负载均衡,Keepalived通过VRRP实现VIP自动漂移;双机热备架构中,主备节点配置相同virtual_router_id、不同priority,配合健康检查脚本、notify通知及时间同步防脑裂。

为什么需要Nginx + Keepalived组合
单台Nginx容易成为单点故障,一旦宕机整个集群入口就不可用。Keepalived通过VRRP协议实现虚拟IP(VIP)的自动漂移,配合Nginx做反向代理和负载分发,能同时解决负载均衡和高可用两个核心问题。关键不在于各自多强大,而在于它们分工明确:Nginx管流量调度,Keepalived管IP接管。
基础部署结构怎么搭
典型双机热备架构:两台服务器(比如node1、node2),都装Nginx和Keepalived,共用一个虚拟IP(如192.168.1.100)。正常时VIP只绑定在主节点上,Nginx对外提供服务;当主节点宕机,Keepalived检测失败后,VIP秒级切换到备节点,用户无感续连。
- 两台机器网络互通,关闭防火墙或放行VRRP组播(默认224.0.0.18)和Nginx端口(如80/443)
- Nginx配置需一致,后端指向真实应用服务器(如Web集群),用upstream定义负载策略(轮询、ip_hash等)
- Keepalived配置中指定同一vrrp_instance名、相同virtual_router_id(1-255)、不同priority(主高备低),并启用nopreempt避免脑裂
Nginx负载均衡怎么配才稳
光靠默认轮询不够,得加健康检查和容错机制。Nginx本身不带主动探活,但可通过proxy_next_upstream指令在后端失败时自动转发给下一台,配合keepalive连接复用提升效率。
- 在upstream块里加max_fails=3 fail_timeout=30s,连续3次失败就剔除该节点30秒
- 用proxy_next_upstream Error timeout http_500 http_502 http_503 http_504覆盖常见异常场景
- 开启keepalive 32和proxy_http_version 1.1,复用后端长连接,减少握手开销
Keepalived高可用怎么防脑裂
脑裂(split-brain)指主备同时认为自己是MASTER,VIP重复绑定导致服务混乱。除了设置不同priority,还要靠脚本+权重联动和通知机制来加固。
- 写个检测Nginx是否存活的脚本(如curl -I http://127.0.0.1:80 | head -1),在keepalived配置里用vrrp_script调用,失败则降低本机weight
- 启用notify_master / notify_backup,在角色切换时发邮件或写日志,便于快速定位
- 确保两节点时间同步(chrony或ntp),避免因时间差影响VRRP状态判断
基本上就这些。不复杂但容易忽略细节,比如VRRP组播被交换机过滤、SElinux阻止绑定VIP、Nginx配置语法错误导致reload失败——上线前务必逐项验证。