mysql如何实现数据库集群的平滑扩容_mysql副本集增加节点

3次阅读

mysql主从架构新增从库需确保主库无抖动、同步不中断、应用配置不变;须用一致位点同步,通过mysqldump–single-transaction导出,中间件需手动注册并调优健康检查。

mysql如何实现数据库集群的平滑扩容_mysql副本集增加节点

MySQL 主从架构下加从库节点,不是副本集

MySQL 本身没有“副本集”概念,那是 mongodb 的术语。你实际要做的,是往现有主从集群里新增一台 slave 节点——这是最常见、也最可控的扩容方式。

关键不在于“能不能加”,而在于“加的时候主库有没有抖动”“从库同步会不会断”“应用要不要改配置”。核心原则:新从库必须从主库某个一致位点开始同步,且不能影响主库写入性能。

  • 优先用 mysqldump --single-transaction --master-data=2 导出,适用于小到中等规模库(
  • 大库建议用 Percona XtraBackup 做物理热备,备份期间主库几乎无压力,恢复后直接 START SLAVE
  • 别在主库高负载时执行 FLUSH TABLES WITH READ LOCK,这会卡住所有写请求;--single-transaction 已足够

CHANGE MASTER TO 指向哪个 binlog 位置最安全

新从库启动复制前,必须告诉它从哪条 binlog 文件、哪个偏移量开始追。这个位置错了,轻则数据不一致,重则复制中断报错 Could not find first log file name in binary log index file

最稳妥的做法不是靠猜,而是用主库当前状态锁定:

  • 在主库执行 SHOW MASTER STATUS,记下 FilePosition;但注意:这个位置是“此刻”的,如果备份耗时长,中间主库已写入新日志,直接用它会导致从库跳过部分事件
  • 正确做法:备份命令里加 --master-data=2,它会在 dump 文件开头写入注释形式的 CHANGE MASTER TO MASTER_LOG_FILE='xxx', MASTER_LOG_POS=yyy,这个位置和 dump 内容严格对应
  • 如果用 XtraBackup,恢复完执行 xtrabackup_binlog_info 文件里的坐标,比 SHOW MASTER STATUS 更准

从库加完就上线?先检查这些再切流量

从库 START SLAVE 后,不代表它就能接读请求了。很多团队跳过验证,结果发现延迟飙升或 SQL 线程早挂了。

  • 必须确认 Seconds_Behind_Master0 且稳定,而不是“刚启动时是 0,过两分钟变成 120”
  • 检查 SHOW SLAVE STATUSGSlave_IO_RunningSlave_SQL_Running 都是 YesSQL_Delay 必须为 0(除非你主动设了延迟复制)
  • 跑个简单查询对比主从:比如 select COUNT(*) FROM user WHERE id > 100000,两边结果得一致;别只查 SELECT 1
  • 观察 5–10 分钟复制线程 CPU 和磁盘 IO,避免新从库因硬件弱于其他节点而持续积压

读写分离中间件怎么感知新从库

如果你用了 ProxySQLShardingSphere-Proxy 或自研路由层,新加的从库不会自动被识别。不手动注册,流量根本不会打过去。

  • ProxySQL 需执行 INSERT INTO mysql_servers(hostgroup_id, hostname, port) VALUES (2, 'new-slave-ip', 3306),再 LOAD MYSQL SERVERS TO RUNTIME
  • ShardingSphere-Proxy 要改 server.yaml 里的 databaseNamedataSources 列表,重启或调用 refresh API
  • 别忘了健康检查配置:有些中间件默认 ping 超时是 3 秒,新从库网络稍慢就会被踢出,得调宽 healthCheckTimeoutMillis

真正麻烦的从来不是加一台机器,而是让整个链路——从备份坐标、复制起点、中间件注册、监控告警、到应用连接池——全部对齐一个时间点。漏掉任意一环,平滑就变成了故障窗口。

text=ZqhQzanResources