mysql如何排查复制延迟突增原因_mysql大事务复制诊断

1次阅读

seconds_behind_master突增需先确认是否真实延迟：检查show slave status中seconds_behind_master持续上升、io/sql线程均运行正常、read_master_log_pos与exec_master_log_pos差距大；再定位大事务、binlog格式、relay log元数据及并行复制配置。

查 `Seconds_Behind_Master` 为什么突然变大

复制延迟突增，第一反应不是重启或跳过，而是确认它是否真实存在。很多情况下 Seconds_Behind_Master 显示几百秒，但实际只是主从网络抖动、从库 IO 线程短暂卡住，或主库 binlog 刷盘慢导致的假象。

先执行：

SHOW SLAVE STATUSG

，重点看三处：

Seconds_Behind_Master 非 NULL 且持续上升 → 真延迟
Slave_IO_Running: Yes 且 Slave_SQL_Running: Yes → 复制线程没挂，问题在 SQL 线程执行层
Exec_Master_Log_Pos 和 Read_Master_Log_Pos 差距极大 → IO 线程拉得慢，可能是主库压力大、网络丢包、或从库磁盘 I/O 延迟高

定位是不是大事务在拖慢 SQL 线程

mysql 5.7+ 的单线程复制（slave_parallel_type = database 或未启用并行复制）下，一个大事务会阻塞后续所有事务执行，哪怕它只占 1% 的变更量，也可能让延迟堆积几十分钟。

在从库上查正在执行的复制事务：

select * FROM performance_schema.Events_transactions_current WHERE EVENT_NAME = 'transaction' AND STATE = 'COMMITTING';

再结合 information_schema.INNODB_TRX 查长时间未提交的事务。

如果 TRX_ROWS_MODIFIED > 100000，基本就是它了
注意 TRX_STARTED 时间戳，和 SHOW SLAVE STATUS 里 Exec_Master_Log_Pos 对应的 binlog 位置比对，确认是否卡在这个事务上
别直接 KILL —— 可能触发回滚风暴；优先用 STOP SLAVE + 等待它自然提交/回滚，再 START SLAVE

检查 binlog 格式和大事务写入方式

binlog_format = STATEMENT 时，某些函数（如 NOW()、UUID()、用户变量）会导致从库执行结果不一致，SQL 线程可能反复重试或卡死；而 ROW 格式下，大事务会产生巨量 binlog event，从库解析 + 应用压力陡增。

用 SHOW VARIABLES LIKE 'binlog_format'; 确认格式
查主库最近的大事务：抓取 mysqlbinlog --base64-output=DECODE-ROWS -v 输出，看单个 GTID_LOG_EVENT 后是否跟着数十万行 WRITE_ROWS_EVENT
应用端若用 INSERT ... SELECT 或 LOAD DATA INFILE 写入，务必加 SET session binlog_row_image = MINIMAL;（5.6+）减少日志体积

监控和预防：别等延迟爆了才看

靠人工查 SHOW SLAVE STATUS 永远是被动响应。真正有效的做法，是把几个关键指标变成可告警的数字。

采集 Seconds_Behind_Master + Read_Master_Log_Pos – Exec_Master_Log_Pos（即 relay log 落后字节数），后者比前者更稳定，不受主库时钟影响
定期查 SELECT count(*) FROM mysql.slave_relay_log_info; —— 如果这个表为空或更新时间停滞，说明 relay_log_info_repository = table 没生效，复制元数据可能丢失
主库开启 long_query_time = 1 + log_slow_slave_statements = ON，让从库慢查询也进 slow log，方便回溯

大事务本身不可怕，可怕的是它在复制链路里变成单点瓶颈。最常被忽略的一点：即使开了并行复制（slave_parallel_workers > 0），只要事务跨库、或用了 autocommit=0 手动事务，依然会退化为串行执行。

发表于：开发工具

近一天内

复制链接

sublime如何快速删除光标前所有内容_Sublime删除行首快捷键【快捷键】

composer如何安装并在ThinkPHP中配置JWT认证插件_composer扩展实战【指南】

VSCode在macOS上的最佳实践

sublime怎么运行HTML网页_sublime在浏览器中预览网页方法【详解】

Python timedelta.microseconds 属性的准确含义解析

mysql如何排查复制延迟突增原因_mysql大事务复制诊断

查 `Seconds_Behind_Master` 为什么突然变大

定位是不是大事务在拖慢 SQL 线程

检查 binlog 格式和大事务写入方式

监控和预防：别等延迟爆了才看

mysql是否可以在多个列上创建单独索引_mysql索引设计技巧

Golang切片(Slice)入门_动态数组的创建与基本操作

SQL Vitess 的 VTGate / VTTablet / VTCoord 的分层架构与查询路由实践

后代选择器匹配太宽泛怎么办_通过子选择器和类限定范围

Python 异常链机制原理解析

mac使用vscode怎么打开编译器终端

mysql如何优化内存中临时表排序_mysql max_length_for_sort_data

composer如何设置autoloader-suffix_composer自定义自动加载后缀【隔离】

CSS如何制作具有深度感的悬浮提升效果_通过transition配合translateY和阴影

CSS如何实现响应式的图片卡片_利用百分比margin保持比例

mysql如何排查复制延迟突增原因_mysql大事务复制诊断

查 Seconds_Behind_Master 为什么突然变大

定位是不是大事务在拖慢 SQL 线程

检查 binlog 格式和大事务写入方式

监控和预防：别等延迟爆了才看

查 `Seconds_Behind_Master` 为什么突然变大