PHP怎么加编码_PHP输出JSON含中文乱码怎么加编码避免【技巧】

1次阅读

根本原因是json_encode()只处理utf-8字符串,若输入非utf-8(如gbk),会返回false或空字段;必须确保数据源(数据库、文件、post等)统一转为utf-8后再encode。

PHP怎么加编码_PHP输出JSON含中文乱码怎么加编码避免【技巧】

php 输出 json 中文乱码,根本原因不是没加编码,而是 json_encode() 默认只处理 UTF-8 字符串 —— 如果输入数据本身不是 UTF-8(比如 GBK/GB2312 来源的字符串),直接 encode 就会出 或空字段。

确认原始数据编码是否为 UTF-8

很多乱码问题其实卡在源头:数据库、文件、POST 数据、第三方接口返回值本身不是 UTF-8。不能只盯着 header()mb_internal_encoding()

  • mb_detect_encoding($str, ['UTF-8', 'GBK', 'GB2312'], true) 检查字符串真实编码(注意第三个参数 true 表示 strict 检测)
  • mysql 连接必须设为 UTF-8:mysqli_set_charset($conn, 'utf8mb4')pdo DSN 加 ;charset=utf8mb4
  • 读取本地文件时,用 file_get_contents() 后先 mb_convert_encoding($content, 'UTF-8', 'GBK') 转码(按实际源编码填)

json_encode() 前必须确保所有字符串是 UTF-8

json_encode() 对非 UTF-8 字符串行为未定义 —— 5.4+ 返回 false,旧版可能静默替换为空或问号。它不负责转码,只负责编码。

  • 数组整体转码不可靠,要逐字段检查:is_string($val) && !mb_check_encoding($val, 'UTF-8')
  • 推荐封装一个安全 encode 函数:
    function safe_json_encode($data) {     array_walk_recursive($data, function (&$item) {         if (is_string($item) && !mb_check_encoding($item, 'UTF-8')) {             $item = mb_convert_encoding($item, 'UTF-8', 'GBK'); // 按实际源编码调整         }     });     return json_encode($data, JSON_UNESCAPED_UNICODE | JSON_INVALID_UTF8_SUBSTITUTE); }
  • JSON_INVALID_UTF8_SUBSTITUTE(PHP 7.2+)可让非法 UTF-8 字节被替换成 ,避免整个 encode 失败

http 响应头和浏览器解析无关 JSON 编码

设置 header('Content-Type: application/json; charset=utf-8') 是良好实践,但它**不影响 json_encode() 的输出内容**,只告诉浏览器“接下来的字节流按 UTF-8 解释”。如果 JSON 体本身含非法 UTF-8,加 header 也没用。

立即学习PHP免费学习笔记(深入)”;

  • chrome/firefox 解析 JSON 时完全忽略响应头中的 charset,只认 JSON 文本是否合法 UTF-8
  • mb_internal_encoding('UTF-8') 仅影响 mb_* 系列函数,默认编码,对 json_encode() 无作用
  • 不要用 iconv('GBK', 'UTF-8//IGNORE', $str)//IGNORE 可能截断多字节字符,mb_convert_encoding() 更稳妥

真正关键的就两点:数据进来时转成干净 UTF-8,再进 json_encode();别指望 header 或内部编码设置能“自动修复”乱码。很多线上问题反复出现,是因为只改了输出 header,却没查数据库连接或 POST 数据的实际编码。

text=ZqhQzanResources