mysql如何搭建集群测试环境_mysql集群实验配置

9次阅读

快速搭建mysql主从复制只需两台docker容器,主库配server-id=1、log-bin、binlog-format=ROW,从库仅设server-id=2,用CHANGE REPLICATION SOURCE TO动态配置,确保Slave_IO_Running和Slave_SQL_Running均为Yes。

mysql如何搭建集群测试环境_mysql集群实验配置

MySQL 主从复制集群怎么快速搭起来做测试

本地快速验证主从同步逻辑,不需要高可用或自动故障转移,用两台 Docker 容器最省事。关键不是“搭集群”,而是让 SHOW SLAVE STATUSGSlave_IO_RunningSlave_SQL_Running 都是 Yes

常见卡点:从库连不上主库(报错 Error 2003 (HY000))、GTID 不一致导致启动失败、server-id 重复或没设。Docker 网络模式选 bridge 就行,别用 host —— macOS/windows 上 host 模式不生效,反而误导排查。

  • 主库配置加三行:server-id = 1log-bin = mysql-binbinlog-format = ROW
  • 从库只加 server-id = 2(必须和主库不同),其他靠 CHANGE REPLICATION SOURCE TO 命令动态配
  • 主库建复制用户时,主机名别写 localhost,用 % 或具体容器 IP;否则从库连不过来
  • 执行 START REPLICA; 前,先在从库上 STOP REPLICA; 再重置位点,避免残留状态干扰

MySQL 8.0 GTID 模式下怎么避免 Cannot add or update a child row: a foreign key constraint fails

这不是外键问题,是 GTID 复制里事务顺序被破坏的典型表现——比如主库手动跳过一个事务,但从库没同步跳过,后续事务依赖被跳过的那个,就崩了。测试环境最容易在模拟故障恢复时踩中。

  • 主从都开启 GTID:gtid_mode = ONenforce_gtid_consistency = ON,缺一不可
  • 不要用 SET GLOBAL sql_slave_skip_counter = 1(已废弃),改用 SET GTID_NEXT = 'xxx'; BEGIN; COMMIT; 注入空事务
  • 查从库延迟:看 Seconds_Behind_Master,但更准的是比对 Retrieved_Gtid_SetExecuted_Gtid_Set 差集
  • 如果已经报错,别硬启复制;先 STOP REPLICA;,用 select * FROM performance_schema.replication_applier_status_by_coordinator; 看卡在哪条事务

用 MySQL Shell AdminAPI 搭 InnoDB Cluster 为什么连不上 mysqlsh --uri root@localhost:3306

AdminAPI 默认走 X Protocol(端口 33060),不是传统 SQL 连接。用 --uri 连 3306 就是错的,会卡住或报 access denied for user 'root'@'localhost'(其实是协议不匹配)。

  • 确认 MySQL 实例开了 X Plugin:SELECT PLUGIN_NAME, PLUGIN_STATUS FROM INFORMATION_SCHEMA.PLUGINS WHERE PLUGIN_NAME = 'mysqlx'; 返回 ACTIVE
  • 连接必须用 X 协议端口mysqlsh --uri root@localhost:33060,或者不写端口让客户端自动探测(前提是服务端配置了 mysqlx_port = 33060
  • 首次创建集群前,所有节点要关掉 SElinux / firewall,Docker 容器记得暴露 33060 端口,不只是 3306
  • dba.createCluster('test')Host is not reachable,大概率是节点间 DNS 解析失败——测试环境直接用 --localAddress 指定 IP,别依赖 hostname

测试环境要不要开 semi-sync replication

不开。测试主从延迟、断网重连、日志轮转这些场景,开 semi-sync 反而掩盖问题。它会让主库等从库 ACK 才返回成功,本地 Docker 环境网络稳定,延迟几乎为 0,起不到验证作用,还可能因超时参数(rpl_semi_sync_master_timeout)引发误判。

  • 真正需要 semi-sync 的是生产写一致性要求高的场景,比如金融类事务
  • 测试时想观察“主库提交后从库多久才执行”,关掉它,直接查 Exec_Master_Log_Pos 和主库 SHOW MASTER STATUS 对比
  • 如果非要开,记得主从都装插件:INSTALL PLUGIN rpl_semi_sync_master SONAME 'semisync_master.so';,且从库也要装 rpl_semi_sync_slave

集群配置里最容易被忽略的是时间同步——Docker 容器默认不跟宿主机时间走,SELECT NOW() 在主从上差几秒,某些基于时间戳的 binlog 过滤规则就会失效。跑之前先 docker run-v /etc/localtime:/etc/localtime:ro

text=ZqhQzanResources