SQL 如何通过约束提升数据质量?

8次阅读

NOT NULL约束必须由数据库引擎强制执行才能真正起效,仅字段定义中声明不够;新增非空字段需配合default或分步UPDATE+SET NOT NULL;须查系统表验证、警惕ORM绕过及批量导入跳过校验。

SQL 如何通过约束提升数据质量?

NOT NULL 约束为什么不能只加在字段定义里?

NOT NULL 是最基础的数据质量防线,但很多人只在建表时写进字段定义,后续业务变化后忘了补约束,导致空值悄悄混入。真正起效的前提是:它必须被数据库引擎强制执行,而不是靠应用层“自觉不传 null”。

实操建议:

  • 新增字段带 NOT NULL 时,若表非空,必须同时指定 DEFAULT 值或先用 ALTER table ... ADD column 加可空字段,再用 UPDATE 填值,最后 ALTER COLUMN ... SET NOT NULL
  • 检查已有列是否真被约束:查询系统表,比如 postgresqlselect column_name, is_nullable FROM information_schema.columns WHERE table_name = 'xxx'mysqlDESCRIBE table_name 中的 Null
  • 注意 ORM 框架(如 Djangohibernate)可能绕过数据库级约束,直接插入 NULL —— 要确认其生成的 DDL 包含 NOT NULL,且未设置 allow_null=True 类似开关

CHECK 约束在不同数据库中的行为差异

CHECK 是表达业务规则最直接的方式,比如 age BETWEEN 0 AND 150email LIKE '%@%',但它在各数据库中支持度和默认行为差别很大。

常见问题与应对:

  • MySQL 5.7 及以前会解析 CHECK 但完全不执行,8.0.16+ 才真正生效;PostgreSQL 和 SQL Server 默认严格校验;sqlite 需启用 PRAGMA ignore_check_constraints = OFF(默认已开启)
  • PostgreSQL 允许在 CHECK 中调用函数(如 Length(phone) = 11),但 MySQL 不支持函数表达式,只能用确定性标量运算
  • 批量导入数据(LOAD DATA INFILEcopy)可能跳过 CHECK,PostgreSQL 的 COPY 会校验,MySQL 的 LOAD DATA严格模式下才报错

外键约束失效的三个隐蔽原因

外键本该保证引用完整性,但线上常出现“子表有记录,父表主键却没了”的情况,多数不是没加约束,而是约束被悄悄禁用或绕过。

排查重点:

  • MySQL 中 FOREIGN_KEY_CHECKS = 0 会被某些迁移工具dba 临时关闭,之后忘记恢复;可通过 SELECT @@FOREIGN_KEY_CHECKS 实时确认
  • 字段类型不严格一致:比如父表 id BIGINT UNSIGNED,子表 parent_id BIGINT(无符号缺失),MySQL 会静默忽略外键,不报错也不生效
  • 索引缺失:外键列必须有索引(单列或作为前导列),否则 PostgreSQL 和 MySQL 都拒绝创建;但有些旧版本 MySQL 允许创建无索引外键,运行时性能极差且校验不可靠

UNIQUE 约束与业务唯一性之间的 gap 怎么填?

UNIQUE 能防重复,但真实业务中“唯一”往往有条件,比如“每个用户每种通知类型最多一条未读记录”,这种复合逻辑无法靠单个 UNIQUE 约束覆盖。

更可靠的组合方式:

  • 用部分索引(PostgreSQL)或函数索引(oracle/PostgreSQL)实现条件唯一:例如 CREATE UNIQUE INDEX idx_uniq_unread ON notifications (user_id, type) WHERE status = 'unread'
  • 避免用 UNIQUE 替代业务逻辑判断:比如注册时查 email 是否存在,再插入 —— 这中间有竞态窗口;应改用 INSERT ... ON CONFLICT DO NOTHING(PostgreSQL)或 INSERT IGNORE(MySQL),让约束本身兜底
  • 注意 NULL 处理:多数数据库中,UNIQUE 约束允许多个 NULL(因 NULL ≠ NULL),如果业务要求“邮箱为空也算唯一”,得用函数索引把 NULL 映射为固定字符串再约束

约束不是加完就高枕无忧的。它们依赖数据库配置、版本特性、字段类型一致性,甚至客户端连接参数。最容易被忽略的是:约束只在校验写入路径,对历史脏数据无效,上线前必须做一次全量清洗。

text=ZqhQzanResources