Python字符串编码错误怎么办_unicode问题排查

1次阅读

python字符串编码错误本质是unicode与字节转换不匹配，需明确编/解码编码；unicodeencodeerror是str→bytes失败，unicodedecodeerror是bytes→str失败；读文件先用chardet探测编码再指定，写文件和http请求优先utf-8，json输出设ensure_ASCII=false，终端乱码需统一环境编码。

Python字符串编码错误本质是Unicode字符串和字节序列之间转换不匹配，核心在于“该用什么编码解、该用什么编码编”。只要理清数据来源和目标环境，问题基本能定位清楚。

先看报错类型，分清是“编不出”还是“解不开”

两种异常对应两类操作：

UnicodeEncodeError：字符串（str）→ 字节（bytes）失败。比如 "中文".encode('ascii') —— ASCII 压根不认中文，直接报错。
UnicodeDecodeError：字节（bytes）→ 字符串（str）失败。比如用 open('file.txt').read() 读一个GBK文件，Python 默认按UTF-8去解，字节对不上就崩溃。

读文件时乱码或报错？先查实际编码再指定

别猜，用 chardet 探测：

安装：pip install chardet

检测示例：

import chardet with open('data.txt', 'rb') as f:     raw = f.read() print(chardet.detect(raw)['encoding'])  # 输出类似 'gbk' 或 'utf-8-sig'

读取时显式传参：with open('data.txt', 'r', encoding='gbk') as f:

写文件或发请求前，统一用UTF-8编码

除非对接老旧系统（如某些windows本地工具），否则优先选UTF-8：

立即学习“Python免费学习笔记（深入）”；

写文件：with open('out.txt', 'w', encoding='utf-8') as f:
HTTP请求（requests）：r = requests.get(url); r.encoding = 'utf-8'; text = r.text
JSON输出避免u4f60u597d：json.dumps(data, ensure_ascii=False)

终端/ide显示乱码？不是代码问题，是环境没配对

代码里字符串是对的，但终端用GBK解UTF-8字节，自然成“锟斤拷”：

Windows命令行：运行 chcp 65001 切到UTF-8模式
VS Code：检查设置中 files.encoding 是否为 utf8
Linux/macos：确认 locale 输出含 UTF-8，例如 LANG=en_US.UTF-8

发表于：后端开发

近一天内

复制链接

微服务架构中的六边形架构是什么？

怎么批量导入phpwaf规则_phpwaf规则批量导入导出法【方法】

Python Flask如何返回一个XML响应

php函数如何生成验证码 php函数创建图片验证码的步骤

XML文件行宽限制解决XML一行过长编辑器卡顿

Python字符串编码错误怎么办_unicode问题排查

先看报错类型，分清是“编不出”还是“解不开”

读文件时乱码或报错？先查实际编码再指定

写文件或发请求前，统一用UTF-8编码

终端/ide显示乱码？不是代码问题，是环境没配对

css如何设置自定义字体_通过@font-face引入自定义字体文件

计算两个事件序列每日重叠时长的Python实现方法

C++ 悬挂指针（Dangling Pointer）是什么？（如何通过指针置空避免崩溃）

CSS响应式布局中的Overflow处理_防止手机端出现横向滚动条

PHP表单怎样判断必填项为空_判断必填项PHP表单条件法【必填】

C#如何配置OpenTelemetry .NET应用可观测性配置教程

Sublime如何快速将数字序列递增填充？（自动化编号）

Go语言中的基本运算符优先级 Golang表达式计算顺序

C#如何配置OpenTelemetry .NET应用可观测性配置教程

mysql执行SQL语句的顺序是什么_SQL执行阶段解析