mysql查询优化中的排序与GROUP BY性能提升

17次阅读

ORDER BY 未走索引需先查执行计划并核对排序字段顺序;必须满足最左前缀原则且ASC/DESC方向一致,混合方向或非最左字段将触发filesort。

mysql查询优化中的排序与GROUP BY性能提升

ORDER BY 没走索引?先看执行计划和排序字段顺序

mysqlORDER BY 使用索引有严格限制:必须满足最左前缀原则,且排序方向(ASC/DESC)需一致。如果查询中混合了 ASCDESC,或排序字段不在联合索引最左侧,优化器大概率会放弃索引而走 filesort。

  • EXPLaiN select ... ORDER BY 查看 Extra 列是否含 using filesort
  • 联合索引 (a, b, c) 可支持 ORDER BY a, bORDER BY a, b, c(全 ASC 或全 DESC),但不支持 ORDER BY a ASC, b DESC(8.0.12+ 支持,但需显式创建降序索引)
  • 如果只查少量字段,考虑覆盖索引:把 SELECT 字段也加入索引末尾,避免回表

GROUP BY 为什么慢?本质是隐式排序 + 临时表

GROUP BY 默认会对分组字段做排序(除非加 ORDER BY NULL),且当结果集超出 tmp_table_sizemax_heap_table_size 时,会从内存临时表退化为磁盘临时表,性能断崖下跌。

  • 确认是否真需要排序:在语句末尾加 ORDER BY NULL 可跳过隐式排序
  • 检查 SHOW VARIABLES LIKE 'tmp_table_size',若常出现 Created_tmp_disk_tables 增长,说明临时表频繁落盘
  • EXPLAIN 观察 type 是否为 ALL(全表扫描);如是,优先给 GROUP BY 字段建索引
  • 避免在 GROUP BY 中使用函数或表达式,例如 GROUP BY date(create_time) 会导致索引失效

ORDER BY + GROUP BY 共存时的典型陷阱

当一条语句同时含 GROUP BYORDER BY,MySQL 会先分组再排序,若两者字段不一致,极易触发双重排序和临时表。更糟的是,某些版本(如 5.7)无法复用同一索引兼顾两者。

  • 尽量让 GROUP BYORDER BY 字段完全一致,例如都用 user_id,避免 GROUP BY user_id ORDER BY created_at
  • 如果业务允许,改用子查询分离逻辑:
    SELECT * FROM (SELECT user_id, count(*) cnt FROM logs GROUP BY user_id) t ORDER BY cnt DESC;
  • 对高频聚合场景,考虑物化中间结果:用 CREATE TEMPORARY TABLE 或定期写入汇总表,避开实时计算

索引设计要匹配实际访问模式,不是字段越多越好

ORDER BYGROUP BY 单独建单列索引效果有限;真正有效的是按查询中 WHERE → GROUP BY → ORDER BY → SELECT 的顺序组合索引。但要注意字段选择性——低区分度字段(如 status 只有 0/1)放前面会大幅降低索引效率。

  • 示例:查询 SELECT category, COUNT(*) FROM products WHERE deleted = 0 GROUP BY category ORDER BY COUNT(*) DESC,理想索引是 (deleted, category),而非 (category)(deleted, category, id)
  • SELECT COUNT(DISTINCT column)/COUNT(*) 估算区分度,低于 0.01 的字段慎作索引前导列
  • 注意 NULL 值处理:B-tree 索引中 NULL 被当作最小值统一存放,若字段大量为 NULL,可能使范围查询失效

最常被忽略的一点:GROUP BY 在没有 WHERE 条件时,即使有索引,也可能因统计信息不准导致优化器误选全表扫描——此时手动加 FORCE INDEX 比等它“想明白”更可靠。

text=ZqhQzanResources