防重核心是写入前拦截,首选唯一约束保底线,辅以ON DUPLICATE KEY UPdate或INSERT ON CONFLICT等原子语句,配合幂等键校验,避免先查后插引发的竞态问题。

防止重复写入,核心不是只靠sql去重语句(如 DISTINCT 或 GROUP BY),而是要在数据写入前就拦住重复——靠约束保底线,靠逻辑控流程。
用唯一约束(UNIQUE)锁死重复入口
这是最直接、最可靠的防重手段。在业务上天然不能重复的字段组合(如手机号、订单号、用户+日期组合)上建唯一索引或唯一约束,数据库会在 INSERT/UPDATE 时自动拒绝违反约束的操作。
- 建表时加:`CREATE table user_log (user_id int, log_date DATE, UNIQUE(user_id, log_date));`
- 已有表加:`ALTER TABLE user_log ADD CONSTRaiNT uk_user_date UNIQUE (user_id, log_date);`
- 插入时捕获异常(如 mysql 的 1062 错误码),程序中友好提示“该记录已存在”,而不是让报错穿透到前端
INSERT … ON DUPLICATE KEY UPDATE(MySQL)或 MERGE(SQL Server/postgresql)
当需要“有则更新、无则插入”时,用这类原子语句替代先查后插的逻辑,避免竞态条件(两个请求同时查不到、同时插入成功)。
- MySQL 示例:`INSERT INTO user_points (uid, points) VALUES (123, 10) ON DUPLICATE KEY UPDATE points = points + 10;`(前提是 uid 或组合有唯一约束)
- PostgreSQL 推荐用 `INSERT … ON CONFLICT DO UPDATE`,语义更清晰,支持 WHERE 条件过滤更新范围
- 注意:这类语句依赖唯一约束触发冲突判断,没约束就退化为普通插入,起不到防重作用
应用层加幂等标识 + 数据库校验
对无法强约束的场景(如异步消息、第三方回调),由调用方提供幂等键(如 request_id、trace_id),写入前先查该 ID 是否已处理。
- 建议在业务表中增加 idempotent_key 字段并建唯一索引
- 写入逻辑:`INSERT INTO order_events (order_id, event_type, idempotent_key) VALUES (…, ‘paid’, ‘req_abc123’)` —— 靠唯一约束保证只成功一次
- 比纯应用层缓存(如 redis)更可靠,不依赖外部组件可用性,且持久可查
慎用 select + INSERT 的“先查后插”逻辑
看似直观,但在并发下极易出问题:两次请求几乎同时查,都得到“不存在”,然后都插入成功。
- 除非加行锁(如 SELECT … for UPDATE),但会降低性能,且需事务包裹,使用门槛高
- 如果非用不可,务必把查和插放在同一个事务里,并确认隔离级别(如 REPEATABLE READ)能覆盖风险
- 更推荐用前面提到的唯一约束 + 冲突处理语句替代,简洁且安全
基本上就这些。约束是地基,逻辑是门窗——地基打牢了,门窗怎么设计才放心。不复杂但容易忽略的是:约束要建在真正有意义的业务维度上,而不是随便选个字段。