覆盖索引未命中的常见写法错误(SELECT * vs 只选必要列)

8次阅读

select * 会让覆盖索引失效,因其隐式请求表中所有列,而覆盖索引要求查询涉及的全部字段(SELECT、WHERE、ORDER BY、GROUP BY 等)均被索引 key 或 include 列完全包含。

覆盖索引未命中的常见写法错误(SELECT * vs 只选必要列)

为什么 SELECT * 会让覆盖索引失效

覆盖索引(Covering Index)的前提是:查询所需的所有字段,全部包含在索引的 keyinclude 列中,无需回表查聚簇索引。而 SELECT * 会隐式要求所有列,哪怕你只建了部分列的索引,优化器也大概率放弃使用它——因为无法保证“所有列”都在索引里。

常见错误场景:给 (user_id, create_time) 建了联合索引,却写 SELECT * FROM orders WHERE user_id = 123。此时即使 create_time 是查询条件或排序字段,只要表还有 amountstatus 等未被索引覆盖的列,mysql/postgresql 就会弃用该索引做覆盖扫描,转而走索引 + 回表,甚至全表扫描。

  • MySQL 中可通过 EXPLaiNExtra 字段确认:using index 表示命中覆盖索引;Using index condition + Using where 不等于覆盖,只是用了 ICP;出现 Using filesortUsing temporary 往往已脱离覆盖路径
  • PostgreSQL 需看 EXPLAIN (ANALYZE) 中是否出现 Index Only Scan;若为 Index Scan 并伴随 Heap Fetches > 0,说明发生了回表
  • SQL Server 要检查执行计划里是否为 Index Seek (Non-Clustered)Output List 完全由索引列构成,不含 [table].[column] 这类/聚簇列引用

哪些列必须显式写出才能触发覆盖索引

不是“只写索引里的列”就够,而是查询语句中 SELECTWHEREORDER BYGROUP BY 涉及的所有列,都得被索引覆盖(含 INCLUDE)。漏掉任意一个,就破防。

例如有索引 IX_orders_user_status_incl_amount (user_id, status) INCLUDE (amount)

  • SELECT amount FROM orders WHERE user_id = 123 AND status = 'paid' → 覆盖成立
  • SELECT amount, updated_at FROM orders WHERE user_id = 123updated_at 未被索引,强制回表
  • ⚠️ SELECT user_id, status FROM orders ORDER BY user_id, status → 若索引是 (user_id, status) 且无 INCLUDE,仍可覆盖(排序字段也在 key 中),但加了 LIMIT 1000 后若优化器预估需跳过大量行,可能改用全表扫描

ORDER BY 和 GROUP BY 对覆盖索引的隐形破坏

即便 SELECTWHERE 全部命中索引,ORDER BYGROUP BY 引用的列如果不在索引最左前缀连续序列中,也会导致覆盖失败。MySQL 尤其敏感:它要求排序字段必须是索引的后缀连续部分,且方向一致(ASC/DESC 不能混)。

  • 索引为 (a, b, c)ORDER BY a, b ✅;ORDER BY a, c ❌(跳过了 b);ORDER BY b, c ❌(没以 a 开头)
  • PostgreSQL 更宽松些,支持索引跳跃扫描(Bitmap Index Scan + Sort),但这时已不算“覆盖”,因为多了排序开销和内存消耗
  • GROUP BY x, y 同理:若索引是 (x) 单列,哪怕 SELECT x, count(*),也无法避免对 y 的额外访问(除非用物化视图或生成列索引)

NULL 值和函数表达式让覆盖索引彻底失效

索引本身不存储 NULL(B+Tree 实现差异下,MySQL 的二级索引允许 NULL,但优化器常保守处理),更不存储计算结果。一旦 SELECTWHERE 出现表达式,基本告别覆盖。

  • SELECT id, UPPER(name) FROM users WHERE city = 'Beijing'UPPER(name) 是计算列,不在索引中
  • SELECT * FROM logs WHERE DATE(created_at) = '2024-01-01' → 函数作用于索引列,无法走索引范围扫描,更别说覆盖
  • ⚠️ SELECT id, name FROM users WHERE deleted_at IS NULL → 若 deleted_at 是可空列,且索引未特别设计(如加 WHERE deleted_at IS NULL 的过滤索引),优化器可能认为 NULL 分布稀疏而弃用索引

真正安全的做法,是把表达式逻辑前置到应用层,或建函数索引(PostgreSQL 支持 CREATE INDEX ON t ((UPPER(name)));MySQL 8.0+ 支持函数索引但仅限于虚拟列 + 普通索引组合)。

text=ZqhQzanResources