mysql中的事务日志与事务恢复机制

9次阅读

redo log只存物理页变更，如“page 123 offset 48处4字节从0x1234→0x5678”，由ib_logfile0/1组成96MB环形缓冲区；刷盘由innodb_flush_log_at_trx_commit控制：1（每次commit fsync）、0（每秒刷，丢1秒数据）、2（写OS cache后每秒fsync）；崩溃后通过checkpoint起始重放日志前滚恢复已提交事务；undo log存逻辑反向操作，用于回滚和MVCC快照读，由purge线程清理；健康检查需关注log_write_requests/log_writes比值、undo文件大小及长事务。

mysql中的事务日志与事务恢复机制

mysql 事务日志（redo log）到底存什么、怎么刷

redo log 不记录 SQL 语句，只记录「物理页变更」：比如「把 page 123 的 offset 48 处的 4 字节从 0x1234 写成 0x5678」。它由 ib_logfile0 和 ib_logfile1 组成环形缓冲区，默认大小共 96MB（innodb_log_file_size × 2），写满后自动覆盖最旧日志。

关键点在于刷盘时机受 innodb_flush_log_at_trx_commit 控制：

1：每次 COMMIT 都强制 fsync 到磁盘（最安全，性能最低）
0：每秒刷一次，事务提交时只写入 OS cache（崩溃可能丢一秒数据）
2：写入 OS cache 即返回，但每秒 fsync（崩溃最多丢一秒，但比 0 更可靠）

线上生产库强烈建议保持为 1；若压测发现瓶颈，应先查锁/索引，而非盲目调低该值。

为什么 crash 后能用 redo log 恢复未刷盘的脏页

InnoDB 的数据页（buffer pool 中）和磁盘上的页（data file）并不同步。事务提交时，只要 redo log 已落盘，即使 buffer pool 中的修改还没写回 .ibd 文件，崩溃重启后也能靠 redo log「重放」这些变更，让磁盘页追上内存状态。

恢复过程分三步：

启动时扫描所有 ib_logfile*，找出最后 checkpoint 位置
从 checkpoint 开始顺序读取 redo log，解析出每个物理页修改操作
对对应 page 执行「前滚（roll forward）」——即把日志里记的变更再执行一遍

注意：redo log 只负责「事务已提交但数据未写盘」的恢复，不解决「事务未提交就崩溃」的问题——那部分靠 undo log 回滚。

undo log 怎么参与事务回滚与 MVCC

undo log 存在 ibdata1（或独立 undo tablespace）中，记录的是「逻辑反向操作」：比如 INSERT 对应一条 delete，UPDATE 记录旧值以便还原。它有两个核心用途：

事务回滚：ROLLBACK 时按 undo log 链逆序执行反向操作
MVCC 快照读：select 不加锁时，通过 read view + undo log 链找到本事务可见的版本

undo log 不是无限保留的。一旦所有活跃事务（包括长事务）都不再需要某个 undo log 版本，Purge 线程就会异步清理它。如果存在运行数小时的事务，会导致 undo log 膨胀、ibdata1 持续增长，甚至阻塞 purge —— 这是线上慢查询或未关闭连接引发的典型隐患。

如何验证当前 redo/undo 状态是否健康

别只盯着 SHOW ENGINE INNODB STATUSG 的碎片信息。更直接的观测方式：

检查 redo 压力：
```
SELECT * FROM information_schema.INNODB_METRICS WHERE NAME IN ('log_writes', 'log_write_requests', 'log_padded');
```
若 log_write_requests / log_writes 比值长期 > 10，说明日志写入频繁且小包多，可考虑增大 innodb_log_buffer_size

看 undo 使用情况：

SELECT TABLE_NAME, FILE_SIZE, ALLOCATED_SIZE FROM information_schema.FILES WHERE FILE_TYPE = 'UNDO LOG';

结合 innodb_undo_tablespaces 数量判断是否需收缩

揪出危险长事务：

SELECT trx_id, trx_started, TIME_TO_SEC(NOW() - trx_started) AS duration_sec FROM information_schema.INNODB_TRX ORDER BY duration_sec DESC LIMIT 5;

超过 60 秒的必须定位来源

事务恢复机制不是黑盒——redo 是前滚引擎，undo 是回滚与快照基石，二者协同才构成 ACID 的物理保障。任何绕过它们的“优化”（如关掉 doublewrite、调低 flush_log_at_trx_commit、忽略长事务告警），都在悄悄透支数据一致性。

发表于：运维

2026-01-29

复制链接

Linux ss -s命令详解

Linux命令行入门指南：新手如何快速上手

如何修复按钮悬停动画中图标闪烁导致的 hover 中断问题

PHP探针为何不显示CPU型号_PHP探针不显示CPU型号解决【方案】

mysql函数调用触发器会产生影响吗_mysql执行顺序说明

mysql中的事务日志与事务恢复机制

mysql 事务日志（redo log）到底存什么、怎么刷

为什么 crash 后能用 redo log 恢复未刷盘的脏页

undo log 怎么参与事务回滚与 MVCC

如何验证当前 redo/undo 状态是否健康

trae里php的precision怎么改_trae改小数精度法【技巧】

c++如何利用CPU的SIMD指令实现数据并行？ (AVX/SSE Intrinsics)

composer如何查看某个包的所有历史发布记录_composer版本列表查询方法【实战】

javascript的数组方法有哪些_如何高效使用它们

Golang反射机制的基本原理解析

Sublime如何查看十六进制文件_Sublime内置HexViewer用法【干货】

ethtool -S 显示 rx_no_buffer_count 持续增加的 rx ring buffer 增大经验

PHP后门怎么删除_异常进程占用高是否因后门作祟查法【汇总】

如何使用 inline-block 实现多个 div 的内联排列

systemd mount 单元启动失败显示 “dependency failed” 的 systemctl status 分析