SQL HAVING 过滤性能提升策略

8次阅读

having 混用导致查询变慢，因其在 group by 和聚合计算后执行，无法利用索引下推，且错误将本该在 where 过滤的非聚合条件（如 status = ‘active’）放入 having，增大中间结果集；分组字段无索引时更会引发全表扫描和文件排序。

SQL HAVING 过滤性能提升策略

因为 HAVING 是在分组后才执行的过滤，它必须等 GROUP BY 完成、聚合函数算完，才能筛数据；而 WHERE 在分组前就过滤掉大量行，能显著减少中间结果集大小。很多慢查询其实是把本该写在 WHERE 里的条件错塞进了 HAVING。

比如 HAVING count(*) > 10 没问题，但 HAVING status = 'active' 就是典型错误——status 不是聚合字段，也不依赖分组结果，应改用 WHERE status = 'active'
数据库无法对 HAVING 条件做索引下推，哪怕对应字段有索引，也得先算完所有分组再过滤
某些引擎（如 mysql 5.7）在 HAVING 引用非 select 列或非分组列时还会报错：Unknown column 'x' in 'having clause'

HAVING 本身不触发索引，但它依赖的分组过程会严重受 GROUP BY 字段是否走索引影响。如果分组字段没索引，数据库大概率要全表扫描 + 文件排序（using filesort），这时加再多 HAVING 条件都救不回性能。

检查执行计划：看到 type: ALL 或 Extra: Using temporary; Using filesort 就说明分组没走索引
复合索引要注意顺序：若写 GROUP BY user_id, created_at，索引应建为 (user_id, created_at)，反过来效果差
MySQL 8.0+ 支持函数索引，对表达式分组（如 GROUP BY date(created_at)）可建 INDEX (DATE(created_at))

当业务逻辑强制要求“先分组、再按聚合结果过滤”，又没法优化 GROUP BY 字段索引时，把大表先缩小再分组，往往比直接 GROUP BY ... HAVING 快几倍。

例如统计“近30天下单超5次的用户”：别写 GROUP BY user_id HAVING MAX(order_time) > NOW() - INTERVAL 30 DAY AND COUNT(*) > 5，而是先 WHERE order_time > NOW() - INTERVAL 30 DAY，再分组
嵌套一层 SELECT * FROM (SELECT ... WHERE ...) t GROUP BY ... HAVING ...，让优化器有机会在子查询阶段用上索引
注意 postgresql 对子查询的物化策略（MATERIALIZED vs NOT MATERIALIZED），必要时加 /*+ MATERIALIZE */ 提示（oracle/PG）或强制临时表

MySQL 默认开启 ONLY_FULL_GROUP_BY，这会让看似合法的 HAVING 报错，比如引用了未出现在 GROUP BY 或聚合函数中的非分组列——这不是性能问题，但会阻断上线。

错误信息典型长这样：Expression #1 of SELECT list is not in GROUP BY clause and contains nonaggregated column ...
关掉它虽能跑通，但语义模糊：数据库可能随机选值，结果不可靠；正确做法是补全 GROUP BY 或用 ANY_VALUE()
mariadb 10.3+ 默认更严格，连 ANY_VALUE() 都要显式声明，否则直接报错

真正卡住性能的往往不是 HAVING 本身，而是它前面那步分组有没有被索引兜住，以及过滤逻辑有没有被错误地拖到分组之后。调优时盯着 EXPLAIN 里的 rows 和 Extra 字段，比死磕 HAVING 语法重要得多。

发表于：数据库

2026-02-21

复制链接

SQL XML 聚合与拆分技巧

SVG路径无限旋转动画的CSS实现教程