SQL GROUP BY 的性能瓶颈在哪里？

9次阅读

sql GROUP BY性能瓶颈集中在数据扫描、分组定位和聚合计算三环节：无索引导致全表扫描；隐式排序触发临时表与文件排序；分组键分散或聚合复杂加剧CPU与内存压力。

SQL GROUP BY 的性能瓶颈主要集中在三个环节：数据扫描、分组定位和聚合计算。它不是单纯“慢”，而是每个环节都可能被放大——尤其当数据量上升、索引缺失或写法不当的时候。

全表扫描导致 I/O 和 CPU 暴涨

如果 GROUP BY 字段没有索引，或者索引未被有效利用（比如用了函数、顺序不匹配），数据库只能逐行读取整张表。type=ALL 的 EXPLaiN 结果就是典型信号。百万级表全扫一遍，光磁盘读取就耗掉大半时间。

常见诱因：GROUP BY YEAR(create_time)、GROUP BY UPPER(name)、索引字段顺序与 GROUP BY 不一致
后果：不仅慢，还容易触发并发争抢、锁等待，拖垮整个连接池

临时表和文件排序吃光内存

mysql 默认会对 GROUP BY 字段隐式排序，若无法利用索引顺序完成分组，就会创建临时表（using temporary），并可能落盘排序（Using filesort）。一旦 tmp_table_size 或 sort_buffer_size 不足，就会写磁盘，I/O 成为最大瓶颈。

EXPLAIN 中看到 Using temporary 或 Using filesort 就该警觉
大字段参与分组（如 GROUP BY content）会极大增加临时表体积，极易溢出

分组桶数过多或聚合逻辑过重

分组键越分散、值越多，需要维护的“桶”就越多；聚合函数越复杂（尤其是 DISTINCT、子查询嵌套、jsON 处理），CPU 开销就越大。例如 count(DISTINCT user_id) 在千万级数据上常需哈希+排序双阶段，内存压力陡增。

字符串拼接分组（如 GROUP BY CONCAT(a,b)）既无法走索引，又加重 CPU 和内存负担
select 中带 TEXT/json 字段，即使没用于分组，也可能被拉入临时表参与排序

隐式排序带来无谓开销

在 MySQL 8.0 之前，GROUP BY 总是附带排序行为，哪怕你根本不需要结果有序。这多出来的 O(n log n) 排序成本，在数据量大时非常可观。

解决办法很简单：显式加上 ORDER BY NULL，告诉优化器跳过排序
MySQL 8.0+ 支持松散索引扫描（Loose Index Scan），但前提是索引顺序完全匹配且无 WHERE 干扰

发表于：数据库

2026-01-18

# ai # count # js # json # mysql # NULL # select # sql # using # 字符串 # 并发 # 性能瓶颈 # 数据库 # 聚合函数

复制链接

mysql中如何优化并发访问_mysql并发访问优化方法

mysql表无法打开报错怎么办_mysql表损坏排查方法

mysql表锁和行锁有什么区别_mysql锁粒度对比

如何在mysql中使用InnoDB支持全文索引

SQL 视图的性能陷阱

SQL GROUP BY 的性能瓶颈在哪里？

全表扫描导致 I/O 和 CPU 暴涨

临时表和文件排序吃光内存

分组桶数过多或聚合逻辑过重

隐式排序带来无谓开销

HTML5注释快捷键是什么_常用编辑器快速添加注释的技巧【技巧】

VSCode无法运行怎么回事_常见启动失败原因与解决方法

SQL 使用窗口函数实现去重保留最新记录

html5怎么实现图片混合模式_html5混合模式效果教程【技巧】

如何在 httprouter 中为特定路由精准应用 Negroni 中间件

mysql主从复制有什么作用_mysql高可用方案说明

如何在Golang中通过channel处理并发事件_Golang并发事件的管理与调度方法

php7函数怎么piso移除废弃函数_替换ereg为preg_match【详解】

mysql数据库为什么要分库_mysql数据分区设计

如何使用Golang实现文件下载功能_Golang文件处理与下载优化