php json_encode() 报错“invalid utf-8序列”需检查并修复非法utf-8字符串,可用mb_check_encoding提前校验、mb_convert_encoding转码,并在连接数据库时统一设置charset为utf8mb4。

PHP json_encode() 报错 “Invalid UTF-8 sequence” 怎么办
直接原因是传给 json_encode() 的字符串里混了非法 UTF-8 字节,比如 GBK 编码的中文、二进制垃圾数据、或截断的多字节字符。PHP 不会自动转码,只校验——校验不过就返回 false,且默认不报错(容易被忽略)。
- 加
JSON_THROW_ON_ERROR标志强制抛异常,第一时间暴露问题:json_encode($data, JSON_THROW_ON_ERROR) - 用
mb_check_encoding($str, 'UTF-8')提前筛一遍字符串,非 UTF-8 的先转:mb_convert_encoding($str, 'UTF-8', 'GBK') - 数据库字段如果设的是
latin1或没声明utf8mb4,读出来就是乱码字节,必须在 pdo/mysqli 连接时统一设 charset,不能只靠 PHP 端补救
PHP json_encode() 把中文转成 uXXXX 怎么关掉
这是默认行为,不是 bug。PHP 5.4+ 开始,json_encode() 对非 ASCII 字符做 Unicode 转义,为的是兼容性(尤其老 IE)。但接口文档、日志、调试时看着难受。
- 加
JSON_UNESCAPED_UNICODE标志即可:json_encode($data, JSON_UNESCAPED_UNICODE) - 注意:该标志在 PHP 5.4+ 才有,低于此版本只能自己
preg_replace()替换 uXXXX,但风险高(可能误伤正常 JSON 内容) - 如果用了
JSON_UNESCAPED_UNICODE后响应头仍是Content-Type: application/json,浏览器/客户端一般都能正确解码,无需额外加charset=utf-8(http 规范中 JSON 默认就是 UTF-8)
PHP json_encode() 处理对象时丢失私有属性怎么办
PHP 默认只序列化 public 属性。private/protected 属性不会进 JSON,也不会触发 __get(),除非类实现了 JsonSerializable 接口。
- 最稳妥的方式是让类实现
JsonSerializable接口,重写jsonSerialize()方法,明确返回要导出的字段数组 - 不要依赖
__toString()或魔术方法“绕过”,json_encode()完全不调用它们 - 如果只是临时调试,可用
(Array) $obj强转再 encode,但会暴露出私有属性名带的不可见字符(如"