Linux Redis 集群搭建与调优

1次阅读

redis集群初始化报“node is not empty”需先flushall并清理rdb/aof文件；slot分配不均用reshard均衡；从节点failover失败需检查cluster-require-full-coverage和cluster-replica-no-failover配置。

Linux Redis 集群搭建与调优

redis-cli –cluster create 报错 Node is not empty

集群初始化时提示 Node is not empty，说明目标 redis 实例的 db0 里已有数据或 AOF/RDB 文件残留，redis-cli --cluster create 默认拒绝覆盖。

先连上该节点执行 FLUSHALL，再删掉本地 dump.rdb 和 appendonly.aof（路径看 config get dir 和 config get dbfilename）
确认 redis.conf 中 cluster-enabled yes 已开启，且 port、bind、protected-mode no 都配对——尤其 protected-mode no 在集群通信中不设会直接被拒绝握手
别用 redis-server redis.conf & 启动后立刻跑 --cluster create：Redis 启动有延迟，建议加 sleep 2 或用 redis-cli ping 轮询确认服务就绪

集群 slot 分配不均导致写入卡顿

用 redis-cli --cluster check 发现某些 master 的 slot 数远高于其他节点，写请求集中打到少数实例，CPU 或内存飙升。

分配 slot 时别手敲 16384 个数，用 --cluster create 自动均分；若已部署，用 redis-cli --cluster reshard 迁移，指定源节点 hash slot 范围而非单个 slot
reshard 过程中客户端可能收到 MOVED 或 ASK 重定向，要求 client 支持集群协议（如 Jedis 3.0+、redis-py 4.0+），旧版 client 会报 ConnectionError
迁移大 key（如 >1MB 的 hash）会阻塞源节点，建议提前用 redis-cli --bigkeys 扫描，拆分或剔除

从节点无法自动故障转移（failover）

主节点宕机后，集群没升任从节点，状态卡在 fail? ，应用持续报 CLUSTERDOWN。

检查从节点的 cluster-require-full-coverage no 是否设置——默认是 yes，只要有一个 slot 不可用就拒绝服务；设为 no 才允许部分 slot 下线时继续响应
确认从节点的 cluster-replica-no-failover 是 no（旧版叫 cluster-slave-validity-factor），否则它会主动放弃参选
网络延迟超过 cluster-node-timeout（默认 15000ms）会导致误判，生产环境建议调低到 5000–8000ms，并确保所有节点间 ping 延迟

使用 redis-py 连集群总连错节点或超时

Python 程序用 RedisCluster 初始化后，读写随机失败，日志频繁出现 ConnectionError: Error 111 connecting to xxx:7001。

别传单个节点地址，必须传全部 master 节点（至少一个）：构造时用 startup_nodes=[{"host": "10.0.1.10", "port": "7001"}, ...]
关闭 skip_full_coverage_check=True，否则集群部分不可用时 client 直接抛异常而不是降级访问
连接池参数要显式设大些：max_connections=100、socket_timeout=3，避免短连接风暴压垮节点

集群拓扑变更（如增删节点、reshard）后，client 缓存的 slot 映射不会自动刷新，得靠定期 CLUSTER SLOTS 轮询或等下次 MOVED 触发更新——这个延迟期就是最易出错的时间窗口。

发表于：运维

近一天内

复制链接

Golang依赖注入模式：对比手写注入与框架注入的差异

大量 TIME_WAIT 堆积导致 80 端口无法绑定的 tcp_tw_reuse + net.ipv4.tcp_fin_timeout=15

Linux conntrack 的 nf_conntrack_max 与 nf_conntrack_tcp_timeout_established 调优

Go 中嵌入类型与方法集解析：Mixin 实现原理与编译器行为一致性详解

mysql是否可以在多个列上创建单独索引_mysql索引设计技巧

Linux Redis 集群搭建与调优

redis-cli –cluster create 报错 Node is not empty

集群 slot 分配不均导致写入卡顿

从节点无法自动故障转移（failover）

使用 redis-py 连集群总连错节点或超时

如何在 Python 脚本中区分启动时自动运行与用户手动运行

欧易OKX官方网站（最新域名）欧易App v6.185.0版本功能详解与下载

如何通过比较新旧数组识别被拖动的 HTML 元素

如何让重叠的两个 div 同时支持点击、悬停与滚动？

css 伪类与隐藏元素_如何使用 :not() 隐藏特定的元素

Golang反射处理跨包定义的非导出类型_反射访问的限制

PHP时区设置怎么检测是否成功_验证时区配置的技巧【操作】

Go语言匿名函数如何使用_Golang函数式编程基础

TestNG.xml是什么如何用它来组织和运行测试套件

如何在Golang中将整数转换为指针_unsafe.Pointer(uintptr(x))