mysql版本升级如何影响查询性能_mysql性能变化说明

2次阅读

mysql 5.7升8.0后order by变慢主因是优化器默认启用derived_merge和hash_join,并改用激进filesort策略;json_contains变慢因utf8mb4校验加重且需虚拟列索引;group by报错源于only_full_group_by严格模式;in子查询变慢因半连接优化退化。

mysql版本升级如何影响查询性能_mysql性能变化说明

MySQL 5.7 升级到 8.0 后 ORDER BY 变慢的典型表现

升级后某些带 ORDER BY 的查询响应时间翻倍,尤其是涉及多列排序、JSON 字段或隐式类型转换的场景。这不是偶发问题,而是优化器行为变更导致的确定性退化。

根本原因是 MySQL 8.0 默认启用 optimizer_switch='derived_merge=on,hash_join=on',同时重写了排序算法路径:不再优先走覆盖索引的有序扫描,转而依赖更激进的内存排序(filesort)策略。如果 sort_buffer_size 不足或字段长度大,就会触发磁盘临时文件,性能断崖下跌。

  • 检查是否命中索引排序:执行 EXPLAINExtra 列是否含 using filesort
  • 临时修复:在 SQL 开头加 /*+ USE_INDEX(@sel_1 tbl_name (idx_col)) */ 强制走有序索引
  • 长期方案:对排序字段补全复合索引,例如原查 WHERE a=1 ORDER BY b,c,建 INDEX(a,b,c)

MySQL 8.0 的 JSON_CONTAINS 查询比 5.7 慢 3–5 倍的原因

8.0 对 JSON 字段引入了更严格的 UTF8MB4 校验和解析路径,JSON_CONTAINS 在无索引支持时会全表解析每个 JSON blob,开销远超 5.7 的轻量级匹配逻辑。

关键限制是:即使你在 JSON 字段上建了虚拟列 + 索引,也必须显式使用该虚拟列才能走索引。直接在原 JSON 字段上调用 JSON_CONTAINS 仍会全表扫。

  • 错误写法:WHERE JSON_CONTAINS(meta, '"admin"', '$.roles') → 全表解析
  • 正确写法:先建虚拟列 role_admin TINYINT AS (JSON_CONTAINS(meta, '"admin"', '$.roles')) STORED,再查 WHERE role_admin = 1
  • 注意:虚拟列必须设为 STORED 才能被索引;VIRTUAL 列无法建索引

从 5.6 升级到 5.7 时 GROUP BY 报错 Error 1055 的实质

这不是性能问题,但直接影响查询能否执行——5.7 默认开启 sql_mode='ONLY_FULL_GROUP_BY',要求 select 列必须全部出现在 GROUP BY 子句中,或为聚合函数结果。很多旧业务的“松散 GROUP BY”写法会直接失败。

表面是语法报错,深层影响性能:关闭该模式虽能兼容,但会让优化器放弃对 GROUP BY 的物化优化,改用更慢的临时表 + 文件排序路径,尤其在大数据量下延迟明显升高。

  • 不推荐永久关闭:SET GLOBAL sql_mode=(SELECT REPLACE(@@sql_mode,'ONLY_FULL_GROUP_BY',''))
  • 推荐重构:用 ANY_VALUE() 显式声明非分组列的取值逻辑,例如 SELECT ANY_VALUE(name), count(*) FROM t GROUP BY dept
  • 验证影响:对比 EXPLAIN format=TREE 输出,看是否有 Using temporary; Using filesort

升级后 IN 子查询突然变慢,且 EXPLAIN 显示 select_type=DEPENDENT SUBQUERY

这是 MySQL 5.7+ 对子查询去关联化的默认策略收紧所致。旧版本常把 IN (SELECT ...) 自动转成半连接(semijoin),而新版本在某些条件下(如子查询含 LIMITORDER BY 或外部引用过多)会退化为逐行驱动的关联执行,复杂度从 O(N) 变成 O(N×M)。

一个常被忽略的触发点是子查询里用了用户变量(@var)或 UUID() 这类非确定性函数,这会直接禁用所有子查询优化路径。

  • 快速验证:把子查询单独执行,看是否返回少量结果;若结果集 > 1000 行,IN 效率必然暴跌
  • 替换方案:改用 JOINEXISTS,例如 WHERE EXISTS (SELECT 1 FROM t2 WHERE t2.id = t1.ref_id)
  • 紧急绕过:加提示 /*+ NO_SEMIJOIN(@subq1) */ 强制走传统嵌套循环

版本升级带来的性能变化,往往藏在那些“没报错、只变慢”的查询里。最危险的是优化器自动选错执行计划——它不会警告你,只会默默拖慢接口。上线前务必用生产数据集跑一遍慢日志里的高频查询,别只盯着 DDL 和启动项。

text=ZqhQzanResources