正确配置mysql字符集和排序规则需从服务器、数据库、表到列逐级设置,优先使用utf8mb4和utf8mb4_unicode_ci以支持多语言及准确排序。

在 MySQL 中正确配置字符集和排序规则对数据存储和查询的准确性至关重要,尤其涉及多语言支持时。以下是关键配置方法和步骤。
1. 设置服务器级字符集和排序规则
在 MySQL 启动时通过配置文件设定全局默认值,影响所有新建数据库和表。
编辑 MySQL 配置文件(通常是 my.cnf 或 my.ini),在 [mysqld] 段添加:
[mysqld] character-set-server = utf8mb4 collation-server = utf8mb4_unicode_ci
保存后重启 MySQL 服务使配置生效。utf8mb4 支持完整的 UTF-8 编码,包括 emoji;utf8mb4_unicode_ci 提供更准确的 Unicode 排序规则。
2. 创建数据库时指定字符集
即使服务器已设置默认值,显式声明可避免意外。
创建数据库时使用 CHARACTER SET 和 COLLATE 子句:
CREATE database mydb CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;
若未指定,将继承服务器默认设置。
3. 表和列级别的配置
建表时可单独定义字符集和排序规则,优先级高于数据库和服务器设置。
示例:
CREATE table users ( id INT PRIMARY KEY, name VARCHAR(100) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci, email VARCHAR(150) ) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_unicode_ci;
注意:列上指定的排序规则会覆盖表级设置。
4. 查看当前配置
确认设置是否生效,可通过以下命令查看:
- SHOW VARIABLES LIKE ‘character_set_%’; — 查看字符集配置
- SHOW VARIABLES LIKE ‘collation_%’; — 查看排序规则配置
- SHOW CREATE DATABASE mydb; — 查看数据库创建语句
- SHOW CREATE TABLE users; — 查看表结构定义
5. 修改现有对象的字符集
对已有表或列更改字符集需使用 ALTER 语句。
修改表:
ALTER TABLE users CONVERT TO CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;
仅修改特定列:
ALTER TABLE users MODIFY name VARCHAR(100) CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;
操作前建议备份数据,防止转换异常。 基本上就这些。合理设置字符集和排序规则能避免乱码、排序错误等问题,关键是统一使用 utf8mb4 并明确指定 collation。