sql并发冲突本质是事务间资源争用引发的逻辑矛盾,需通过可控复现、三类日志分析(INNODB STATUS/Error log/information_schema)、SQL关联查询定位阻塞链,并从索引优化、缩短事务、调整隔离级别三方面根治。

SQL并发冲突不是偶然报错,而是多个事务在读写同一数据时因资源争用触发的逻辑矛盾。关键不在“有没有冲突”,而在“怎么快速定位谁、在哪、为什么冲突”。下面从复现到排查,讲清楚实用路径。
复现并发冲突的典型场景
不靠生产环境碰运气,用可控方式快速复现:
- 开两个数据库连接(如两个mysql客户端或SSMS窗口),都执行BEGIN TRANSACTION
- 连接A执行:select * FROM users WHERE id = 100 FOR UPDATE;(加行锁但不提交)
- 连接B立刻执行同样语句或UPDATE users SET name=’x’ WHERE id = 100;
- 此时B会卡住——这就是典型的锁等待;若A和B交叉操作不同行再回环更新,几秒内大概率触发死锁
- 注意:必须关闭自动提交(SET autocommit = 0;),否则事务一执行完就释放锁,看不到冲突
三类核心日志与状态入口
别只盯着报错信息,真正有用的线索藏在三个地方:
- SHOW ENGINE INNODB STATUSG:重点看LATEST DETECTED DEADLOCK(最近死锁详情)和TRANSACTIONS段中状态为LOCK WaiT的事务
- 错误日志(error log):开启innodb_print_all_deadlocks = ON后,每次死锁都会完整记录两个事务的SQL、锁类型、索引、等待链
- information_schema系统表:INNODB_TRX查活跃事务,INNODB_LOCK_WAITS查谁在等谁,用标准关联查询一眼看出阻塞源头
快速定位冲突SQL与事务链
一句SQL就能揪出正在互相卡住的事务:
SELECT r.trx_id AS waiting_trx_id, r.trx_query AS waiting_query, b.trx_id AS blocking_trx_id, b.trx_query AS blocking_query FROM information_schema.INNODB_LOCK_WAITS w JOIN information_schema.INNODB_TRX b ON b.trx_id = w.blocking_trx_id JOIN information_schema.INNODB_TRX r ON r.trx_id = w.requesting_trx_id;
结果里waiting_query是卡住的SQL,blocking_query是它等着的那个SQL。如果blocking_query为空,说明对方已提交或已断开,但锁还没释放完——这时要查INNODB_TRX里的trx_state和trx_started时间,判断是否是长事务拖着不提交。
索引与事务设计是根因所在
90%的写冲突问题,其实跟SQL本身无关,而在于底层支撑没做对:
- UPDATE/delete的WHERE条件字段必须有索引,否则InnoDB会升级为表锁或间隙锁,波及大量无关行
- 事务越短越好——读完马上更新,不要“先查再算再改”,中间插入业务逻辑等于给锁留空档
- 考虑把隔离级别从默认的REPEATABLE READ降到READ COMMITTED,能显著减少间隙锁使用
- 高频更新单行场景(如计数器),可用UPDATE … SET cnt = cnt + 1代替先查后更,避免应用层竞争
基本上就这些。复现是为了理解机制,排查是为了找到那个具体SQL和事务ID,而优化永远落在索引、事务长度和隔离策略上。