php连接数据库中文乱码咋处理_php数据库中文编码设置【技巧】

13次阅读

php连接mysql中文乱码的根本原因是客户端、连接层、表结构三者编码不一致,须统一为utf8mb4:建库建表时显式指定,连接后立即执行SET NAMES utf8mb4或set_charset(‘utf8mb4’),pdo需在DSN中写charset=utf8mb4并建议exec(“SET NAMES utf8mb4”)。

php连接数据库中文乱码咋处理_php数据库中文编码设置【技巧】

PHP 连接 MySQL 时中文显示为问号或乱码

根本原因通常是客户端、连接层、表结构三者编码不一致,而非单纯改 PHP 文件编码。重点不是 mb_internal_encoding() 或文件保存格式,而是连接建立时的字符集声明。

  • 确认 MySQL 服务端默认编码(SHOW VARIABLES LIKE 'character_set_server';),推荐设为 utf8mb4
  • 建库建表时显式指定字符集:CREATE database db_name CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;
  • PHP 连接后**立即**执行 SET NAMES utf8mb4;(PDO 或 mysqli 均需)
  • mysqli 方式下,优先用 $mysqli->set_charset('utf8mb4'); 而非 query("SET NAMES ..."),更可靠

PDO 连接字符串里加 charset 参数没生效?

常见于 PDO 构造时写了 charset=utf8 却仍乱码——因为 utf8 是 MySQL 的伪标准,实际只支持 3 字节 UTF-8;必须用 utf8mb4

  • 正确写法:$pdo = new PDO('mysql:host=localhost;dbname=test;charset=utf8mb4', $user, $pass);
  • 即使 DSN 中指定了 charset,仍建议显式调用 $pdo->exec("SET NAMES utf8mb4"); 防止某些驱动忽略
  • 若使用持久连接(PDO::ATTR_PERSISTENT => true),charset 设置可能被复用旧连接状态,务必在每次操作前检查

mysqli_real_escape_string() 处理中文失败报 Warning

该函数依赖当前连接的字符集。如果连接未正确设为 utf8mb4,它会对多字节字符截断或误判,直接导致 SQL 错误或注入风险。

  • 必须在调用前确保连接已设置字符集:$mysqli->set_charset('utf8mb4');
  • 若用面向对象风格,$mysqli->real_escape_string($str) 才安全;过程式 mysqli_real_escape_string($mysqli, $str) 第一个参数不能是空或未初始化句柄
  • 现代开发更推荐预处理语句(prepare() + bind_param()),完全规避转义问题

phpMyAdmin 显示正常但 PHP 输出乱码

说明数据库和表结构编码没问题,问题出在 PHP 与 MySQL 的「通信协议层」。phpmyadmin 默认会发 SET NAMES utf8mb4,而你的 PHP 脚本没发。

立即学习PHP免费学习笔记(深入)”;

  • 检查是否漏掉连接后的字符集设置,尤其是用了封装类或框架时,可能隐藏了这一步
  • $mysqli->client_info$mysqli->get_charset() 实际验证当前连接使用的字符集
  • 浏览器响应头也可能干扰:确保 PHP 没输出 Content-Type: text/html; charset=gbk 类似语句,或 HTML meta 中声明了错误编码

实际调试时,最易忽略的是「连接复用场景」——比如连接池、长连接、框架自动管理的 PDO 实例,它们可能在首次连接后就没再重置 charset。每次获取连接后做一次 set_charset()exec("SET NAMES ...") 是成本最低的保险做法。

text=ZqhQzanResources