mysql如何进行分组查询_mysqlgroup by语法分析

1次阅读

mysql 8.0.13+ 启用 only_full_group_by 后,select 中非聚合字段必须出现在 group by 中;having 只能引用 select 或 group by 中的列或聚合表达式;order by 需显式指定才能保证分组后顺序;group by NULL 实现全表聚合。

mysql如何进行分组查询_mysqlgroup by语法分析

GROUP BY 后必须出现 SELECT 中的所有非聚合字段

MySQL 8.0.13+ 默认启用 sql_mode=ONLY_FULL_GROUP_BY,这意味着如果 SELECT 列表里有非聚合字段(比如 namestatus),它必须出现在 GROUP BY 子句中,否则报错:Expression #1 of SELECT list is not in GROUP BY clause

常见错误写法:

SELECT id, name, count(*) FROM users GROUP BY status;

这里 idname 既没聚合也没分组,直接报错。解决方式只有三种:

  • idname 加进 GROUP BY(但通常语义不合理)
  • 用聚合函数包裹,如 MAX(name)MIN(id)
  • 临时关闭 ONLY_FULL_GROUP_BY(不推荐,掩盖逻辑问题)

HAVING 和 WHERE 的区别不能只记“过滤时机”

WHERE 过滤行,HAVING 过滤分组 —— 这句话没错,但容易忽略关键约束:HAVING 只能引用 SELECT 中的列或聚合表达式,不能引用原始表字段(除非该字段也在 SELECTGROUP BY 中)。

例如以下写法会报错:

SELECT status, COUNT(*) FROM users GROUP BY status HAVING created_at > '2023-01-01';

因为 created_at 没出现在 SELECTGROUP BY 中,HAVING 看不到它。正确做法是:

  • 改用 WHERE 提前过滤:WHERE created_at > '2023-01-01' GROUP BY status
  • 或把 created_at 加入 GROUP BY(但通常会导致分组过细)
  • 或用聚合函数,如 HAVING MAX(created_at) > '2023-01-01'

ORDER BY 在 GROUP BY 后的行为很实际

分组后默认不保证顺序,即使你写了 GROUP BY x,结果集顺序仍可能随 MySQL 版本、索引、执行计划变化。必须显式写 ORDER BY 才能稳定排序。

注意两个细节:

  • ORDER BY 可以直接用 GROUP BY 字段名,也可以用别名(如 SELECT status AS s, COUNT(*) c GROUP BY status ORDER BY s
  • 如果 SELECT 里用了聚合函数,ORDER BY 也能直接写函数,比如 ORDER BY COUNT(*) DESC,无需别名
  • MySQL 允许 ORDER BY 引用未出现在 SELECT 中的字段,只要它在 GROUP BY 里(但其他数据库postgresql 不允许)

GROUP BY NULL 是个冷门但有用的技巧

GROUP BY NULL 会让整张表聚合成一行,常用于快速统计总数或判断是否存在数据:

SELECT COUNT(*), MAX(updated_at), MIN(created_at) FROM logs GROUP BY NULL;

它等价于去掉 GROUP BY,但显式写出更清晰地表达了“全表聚合”意图。注意它和 SELECT COUNT(*) FROM logs 的执行计划通常一致,但如果你还要同时取多个聚合值(比如最大/最小时间),GROUP BY NULL 更直观。

另一个典型场景是配合 IFNULL 做空值兜底:

SELECT IFNULL(AVG(score), 0) AS avg_score FROM exam_results GROUP BY NULL;

避免空表时返回 NULL 行,而是确保总有一行数值结果。

真正难的是理解哪些字段该放进 GROUP BY、哪些该聚合——这取决于业务语义,不是语法能自动推导的。一个字段是否“天然属于分组维度”,得看它是不是每个分组内都唯一或稳定。别依赖 ANY_VALUE() 来绕过检查,那只是把问题往后拖。

text=ZqhQzanResources