开启慢查询日志并配置报警可有效提升mysql性能监控能力。1. 通过修改my.cnf文件或动态设置开启slow_query_log,指定日志路径和long_query_time阈值;2. 使用pt-query-digest分析日志,识别高耗时SQL;3. 结合prometheus、脚本轮询或Loki等工具实现实时报警;4. 注意合理设置参数、定期归档日志并优化问题语句,避免性能与存储压力。

MySQL 慢查询会影响数据库性能,严重时会导致服务响应变慢甚至超时。及时发现并优化慢查询是运维的重要任务。配置慢查询报警可以帮助你快速定位问题。下面介绍如何开启慢查询日志,并结合工具实现报警机制。
开启慢查询日志
要实现报警,首先要确保 MySQL 已开启慢查询日志功能。
编辑 MySQL 配置文件(通常为 /etc/my.cnf 或 /etc/mysql/my.cnf),在 [mysqld] 段中添加以下参数:
- slow_query_log = ON:开启慢查询日志
- slow_query_log_file = /var/log/mysql-slow.log:指定日志路径(确保目录可写)
- long_query_time = 2:定义执行时间超过多少秒的 SQL 为慢查询(单位:秒)
- log_queries_not_using_indexes = ON(可选):记录未使用索引的查询,便于优化
保存后重启 MySQL 服务或动态生效:
SET GLOBAL slow_query_log = ‘ON’;
SET GLOBAL long_query_time = 2;
使用 pt-query-digest 分析慢查询
pt-query-digest 是 Percona Toolkit 中的工具,能高效分析慢查询日志,找出最耗时的 SQL。
安装 Percona Toolkit(以 centos 为例):
yum install https://repo.percona.com/yum/percona-release-latest.noarch.rpm
yum install percona-toolkit
使用 pt-query-digest 分析日志:
pt-query-digest /var/log/mysql-slow.log
该命令会输出查询统计信息,包括执行次数、平均耗时、总耗时最高的 SQL 等,可用于初步判断问题语句。
配置监控与报警
仅分析不够,需要实时报警。可通过以下方式实现:
- 使用 Prometheus + mysqld_exporter + grafana + alertmanager:
将 MySQL 慢查询日志条目通过 exporter 暴露为指标,在 Grafana 中展示,并设置阈值触发报警。
- 使用脚本轮询慢查询日志数量:
编写 Shell 脚本,定期检查单位时间内新增的慢查询数量,超出阈值则调用 webhook 发送报警。
示例脚本片段:
COUNT=$(awk ‘$NF > 2 {count++} END {print count+0}’ /var/log/mysql-slow.log)
if [ $COUNT -gt 10 ]; then curl -X POST your-alert-webhook-url; fi - 集成 zabbix 或 Prometheus 的日志监控模块:
利用 Loki + Promtail 收集日志,配合 PromQL 查询慢查询增长趋势,实现报警。
优化建议与注意事项
配置完成后需注意以下几点:
- 避免将 long_query_time 设置过低(如 0.1 秒),否则日志量过大影响性能
- 定期清理或归档慢查询日志,防止磁盘占满
- 报警触发后应结合执行计划(EXPLAIN)分析 SQL,优化索引或语句结构
- 生产环境建议只开启必要的日志选项,减少 I/O 压力
基本上就这些。开启慢查询日志是第一步,结合分析工具和报警系统才能真正发挥作用。关键是建立持续监控机制,而不是等出问题再查。