最推荐用 str.isprintable() 判断字符串是否含不可打印字符,它返回 True 当且仅当非空且全为可打印字符;空字符串返回 False,控制符、零宽字符、组合符等均被识别为不可打印。

python 中判断字符串是否包含不可打印字符,最直接的方式是检查每个字符的 Unicode 类别或使用 str.isprintable() 方法——它专为此设计,且行为明确、性能好。
用 str.isprintable() 快速判断
这是最推荐的方法。该方法返回 True 当且仅当字符串非空且所有字符都是可打印的(不含控制字符、换行符、制表符等),空字符串也返回 False。
-
"hello"→True -
"hellon"→False(含换行符) -
"hellot"→False(含制表符) -
""→False(空字符串不视为可打印) -
"hellox00world"→False(含空字符)
定位具体不可打印字符(调试用)
若需知道哪些字符不可打印,可遍历字符串,结合 unicodedata.category() 或直接比对控制字符范围:
- 控制字符的 Unicode 类别以
C开头(如Cc控制符、Cf格式符、Co私有使用、Cn未分配) - 常用做法:导入
unicodedata,对每个字符调用unicodedata.category(c).startswith('C') - 简单替代:检查
ord(c) (粗略过滤 ASCII 控制符,但不覆盖 Unicode 全集)
注意边界情况
某些字符看似“空白”,实则不可打印,容易被忽略:
立即学习“Python免费学习笔记(深入)”;
- 零宽空格(
u200b)、零宽非连接符(u200c)、左至右标记(u200e)等 —— 它们属于Cf类,isprintable()返回False - 全角空格(
u3000)是可打印的(属于Zs分隔符),isprintable()返回True - 组合字符(如重音符号
u0301)属于Mn(标记-非间距),isprintable()返回False
实用检测函数示例
封装一个兼顾判断与提示的函数:
import unicodedata def has_non_printable(s): if not isinstance(s, str): return False if not s: return False return not s.isprintable() def find_non_printable_chars(s): return [ (i, c, unicodedata.category(c), f'U+{ord(c):04X}') for i, c in enumerate(s) if unicodedata.category(c).startswith('C') or ord(c) == 0 ]