mysql中GROUP BY与聚合函数的执行过程

3次阅读

GROUP BY 先完成分组再聚合，无索引时需临时表和文件排序；select 中非分组非聚合列在 only_full_group_by 下报错；count(*) 统计所有行，COUNT(col) 仅非 NULL 行；HAVING 在分组后过滤且不能用索引。

GROUP BY 是先分组再聚合，不是边扫边算

mysql 执行 GROUP BY 时，并非逐行读取就立即调用 COUNT() 或 SUM() 累加。它必须先完成完整的分组划分，才能对每个组独立计算聚合结果。这意味着：如果没索引支撑，MySQL 往往要走临时表 + 文件排序（using temporary; Using filesort），尤其在大表上会明显变慢。

常见错误现象：EXPLaiN 显示 Extra 列含 Using temporary，且查询响应时间随数据量非线性增长。

分组字段无索引 → 强制全表扫描 + 内存/磁盘临时表
SELECT 中出现未分组也未聚合的列（如 SELECT name, COUNT(*) FROM t GROUP BY dept）→ 在 sql_mode=only_full_group_by 下直接报错 Error 1055
聚合函数参数含表达式（如 SUM(price * qty)）→ 不影响分组逻辑，但可能拖慢单行计算速度

聚合函数对 NULL 的处理是默认忽略，不是报错或转 0

COUNT()、SUM()、AVG() 这些函数天然跳过 NULL 值，这是 SQL 标准行为，不是 MySQL 特有。比如 COUNT(col) 只统计非 NULL 行；SUM(col) 对全 NULL 组返回 NULL，不是 0。

容易踩的坑：

COUNT(*) 和 COUNT(col) 结果不同：前者统计所有行，后者只计非空值
AVG(col) 在整数列上返回 DECIMAL 类型，可能引发应用层类型不匹配（如 go 的 int64 接收失败）
想把空组补成 0？得靠 COALESCE(SUM(col), 0)，不能依赖聚合函数自己“兜底”

GROUP BY 后 HAVING 比 WHERE 更晚执行，且能引用聚合结果

WHERE 过滤发生在分组前，操作的是原始行；HAVING 过滤发生在分组后，操作的是每组的聚合结果。所以 HAVING 能写 HAVING COUNT(*) > 10，而 WHERE 写这个会报错。

性能提示：

尽量把过滤条件往前推——能用 WHERE 就别用 HAVING，减少参与分组的行数
HAVING 条件无法利用索引，纯内存过滤，大数据量下慎用复杂表达式
若 HAVING 中用了非聚合字段（如 HAVING dept = 'tech'），MySQL 会允许（依赖 sql_mode），但语义模糊，应避免

ORDER BY 与 GROUP BY 共存时，排序字段必须在 SELECT 列表中或满足函数依赖

当语句同时含 GROUP BY 和 ORDER BY，比如：

SELECT dept, COUNT(*) c FROM emp GROUP BY dept ORDER BY c DESC;

这条合法，因为 c 是 SELECT 列表中的别名，且由聚合生成；但下面这句在 only_full_group_by 下会失败：

SELECT dept, COUNT(*) FROM emp GROUP BY dept ORDER BY name;

因为 name 既没出现在 GROUP BY，也不是聚合结果，MySQL 无法确定每组该取哪个 name 来排序。

解决方式只有两个：

把 name 加进 GROUP BY（改变分组粒度）
用聚合函数包裹，如 ORDER BY MAX(name)

函数依赖规则（MySQL 5.7+）允许某些情况绕过限制，比如 dept 是主键，name 是其依赖列，但这种隐式行为难维护，不建议依赖。

发表于：数据库

四天前

# ai # count # Error # go # mysql # NULL # select # sql # using # 大数据 # 聚合函数

复制链接

SQL事务隔离如何控制_真实案例解析强化复杂查询思维【教程】

php判断字符串长度用array_sum实现_php数组求和测长法【教程】

mysql密码忘了怎么办_mysql忘记密码重置的完整流程

存储过程和函数在MySQL中有什么应用场景？

HTML 简易计算器常见错误解析与正确实现方法

mysql中GROUP BY与聚合函数的执行过程

GROUP BY 是先分组再聚合，不是边扫边算

聚合函数对 NULL 的处理是默认忽略，不是报错或转 0

GROUP BY 后 HAVING 比 WHERE 更晚执行，且能引用聚合结果

ORDER BY 与 GROUP BY 共存时，排序字段必须在 SELECT 列表中或满足函数依赖

PHP过低怎样回滚到旧版本_PHP过低回滚操作步骤【还原】

XAML是什么如何用它来定义WPF和UWP界面

如何使用Golang优化Kubernetes资源调度_Golang 资源调度优化方法

JavaScript Node.js如何用_怎样构建后端服务【教程】

HTML5如何制作复选框_HTML5制作复选框教程【实践】

cssz-index属性使用技巧_控制元素堆叠顺序

css 过渡与背景颜色变化_实现平滑的颜色过渡效果

生成630个1–20之间的随机数，使其总和严格≤3000的PHP实现方案

Composer报错SSL连接失败怎么办_解决Composer证书过期的方法【避坑】

生成630个1–20之间的随机数，使其总和严格不超过3000的PHP实现方案