mysql主从复制的原理是什么_mysql同步机制说明

1次阅读

mysql主从复制完全依赖binlog驱动;io线程负责拉取日志,sql线程负责重放;server-id必须唯一以避免循环复制;异步复制不等待从库确认,存在数据丢失风险。

mysql主从复制的原理是什么_mysql同步机制说明

主从复制靠什么日志驱动?

MySQL 主从复制完全依赖 binlog(二进制日志)——它不是事务日志,也不是 redo log,而是专为复制设计的逻辑变更日志。只要主库启用了 log-bin,所有 DML(INSERT/UPDATE/delete)和部分 DDL(如 CREATE table)操作,都会按执行顺序写入 binlog。从库不直接读主库磁盘,而是通过网络拉取这些日志事件,再重放。

常见错误现象:从库同步延迟、数据不一致、SHOW SLAVE STATUSSeconds_Behind_Master 持续增长——十有八九是 binlog 格式或落盘策略没配对。

  • binlog_format=row 是当前推荐配置:避免函数(如 NOW()UUID())、自增主键、触发器等导致主从不一致
  • 别用 binlog_format=statement 配合 READ-COMMITTED 隔离级别,极易出现主从行数差异
  • sync_binlog=1 + innodb_flush_log_at_trx_commit=1 才能保证主库崩溃后不丢 binlog 事件(但会轻微影响性能)

I/O 线程和 SQL 线程各干啥?为什么不能合二为一?

从库靠两个独立线程完成复制:IO_THREAD 负责“搬运”,SQL_THREAD 负责“执行”。它们解耦设计,是为了应对网络抖动、大事务、锁竞争等现实问题。

典型卡点场景:SQL_THREAD 执行一个耗时 5 分钟的 UPDATE,而 IO_THREAD 已经把后续 10 分钟的 binlog 全部拉到本地 relay-log 里了——这正是 Seconds_Behind_Master 的来源,但复制本身并未中断。

  • IO_THREAD 连接主库后,会持续监听 master.info 记录的位点(File + position),并请求新事件;断连重试由它自动处理
  • SQL_THREAD 每执行完一个 relay-log 事件,就更新 relay-log.info,这是从库“知道自己同步到哪”的唯一依据
  • MySQL 8.0+ 支持多线程复制(slave_parallel_workers > 0),但仅对不同库/表的并发事务有效,单表大事务仍只能串行回放

为什么必须设不同的 server-id

server-id 不是“名字”,而是复制拓扑里的唯一身份标识。主库靠它识别哪个从库在连自己,从库靠它避免 relay-log 被自己再次读取(防止循环复制)。一旦重复,轻则同步停止,重则整个复制链路雪崩。

容易踩的坑:

  • 克隆虚拟机部署 MySQL 后,忘记改 /etc/my.cnf 里的 server-id,两台机器 ID 相同 → START SLAVE 报错 Error 1236 (HY000)
  • docker 容器未绑定固定 server-id,每次重启随机分配 → 复制元数据错乱
  • 级联复制(A→B→C)中,B 既要当 A 的 slave,又要当 C 的 master,必须同时启用 log-bin 和设置唯一 server-id,否则 C 无法从 B 继续同步

异步复制到底“异步”在哪?

异步复制的“异步”,特指主库提交事务时,**不等待任何从库确认**。主库写完 binlog 并刷盘、通知引擎层提交,就立刻返回客户端成功。此时从库可能还没收到这条日志,甚至网络已断。

这意味着:主库宕机瞬间,最后几秒的事务大概率丢失,从库永远追不回来。

  • 想降低丢失风险?开启半同步复制:INSTALL PLUGIN rpl_semi_sync_master SONAME 'semisync_master.so',并设 rpl_semi_sync_master_enabled=1
  • 但要注意:半同步下,若所有从库都超时未响应,主库会自动退化为异步模式(由 rpl_semi_sync_master_timeout 控制),这个降级行为常被忽略
  • 真正强一致?得上 MGR(MySQL Group Replication),但它不是简单开关,而是要重构集群架构和应用容错逻辑

真正难的从来不是配通复制,而是理解每个参数背后承担的风险边界——比如 binlog_format 选错,可能让线上订单号在从库重复;server-id 写错,能让整套灾备切换流程在关键时刻失灵。

text=ZqhQzanResources