mysql主键索引设计有哪些注意点_mysql表结构优化

1次阅读

主键必须是not NULL且unique;推荐用自增整数,避免uuid或字符串;联合主键需谨慎设计顺序与列选择;变更主键代价极高,需上线前定稿。

mysql主键索引设计有哪些注意点_mysql表结构优化

主键必须是 NOT NULL + UNIQUE

mysql 的主键本质就是 PRIMARY KEY 约束,它自动附加 NOT NULLUNIQUE 语义。如果手动定义主键列允许 NULL,建表会直接报错:Error 1171 (42000): All parts of a PRIMARY KEY must be NOT NULL。常见误操作是把业务字段(比如 email)设为主键又忘了加 NOT NULL,结果 DDL 失败。

实操建议:

  • 显式写出 NOT NULL,别依赖隐式行为,增强可读性
  • 避免用可能为空的业务字段(如 phonenickname)当主键
  • 复合主键要格外小心:所有列都必须 NOT NULL,且组合值全局唯一

优先用自增整数(int/BIGINT)做主键

InnoDB 表的聚簇索引就是主键索引,数据按主键物理排序存储。自增整数天然满足递增、紧凑、无意义、写入局部性好这几个关键特性。换成 UUID 或字符串主键,会导致:

  • 页分裂频繁(新记录随机插入到中间页),Innodb_page_splits 指标飙升
  • 二级索引变大(每个二级索引节点都要存完整主键值),浪费空间
  • 范围查询和排序性能下降(字符串比较比整数慢,且无法利用 CPU 预取)

示例对比:

-- 推荐(紧凑、顺序写入) CREATE table user (id BIGINT UNSIGNED PRIMARY KEY AUTO_INCREMENT, ...); <p>-- 不推荐(主键过长,破坏聚簇有序性) CREATE TABLE user (id CHAR(36) PRIMARY KEY, ...); -- UUID v4

联合主键设计要警惕“左前缀失效”和查询覆盖问题

当用多列组成主键(如 (tenant_id, order_id)),InnoDB 的聚簇索引只按该顺序物理排序。这意味着:

  • 单独查 order_id 无法走主键索引,必须建额外索引
  • tenant_id = ? AND order_id > ? 能高效走主键;但 order_id = ? AND tenant_id = ? 虽然能用上,实际执行计划可能因统计信息不准而选错索引
  • 如果常查 tenant_id + 时间范围,把时间列加入联合主键尾部(如 (tenant_id, created_at, order_id))反而更糟——因为 created_at 非单调,破坏写入局部性

真正适合联合主键的场景有限:分库分表后本地唯一、强业务语义约束(如 (user_id, skill_name) 表示用户技能集)、或明确以该组合作为高频查询入口且不单独查询后置列。

主键变更代价极高,上线前必须定稿

修改主键(ALTER TABLE ... DROP PRIMARY KEY, ADD PRIMARY KEY (...))在 InnoDB 中等价于重建整张表:复制数据、重建所有索引、锁表(或至少锁写)。即使使用 ALGORITHM=INPLACE,对大表仍可能卡住数小时,且期间 DML 可能失败或延迟。

容易被忽略的关键点:

  • 外键引用该主键的子表也要同步调整,否则 ALTER 会失败
  • 应用层所有基于旧主键的缓存 key、日志 trace、关联查询逻辑全要检查
  • ORM 框架(如 django/SQLAlchemy)可能硬编码主键名为 id,换联合主键后需显式配置 primary_key=False 并重写逻辑

没有银弹。主键不是越短越好,也不是越“业务化”越好——它是存储引擎的底层契约,选型时得先想清楚数据生命周期、查询模式和扩展路径。

text=ZqhQzanResources