Python 3 中如何为内置类型生成字节串格式化结果

12次阅读

Python 3 中如何为内置类型生成字节串格式化结果

python 3 不支持 `b’%s’ % obj` 这类字节串直接格式化内置对象的语法;正确做法是先用字符串格式化(如 `’%s’ % obj` 或 `str(obj)`),再显式编码为 bytes(如 `.encode(‘utf-8’)`)。

python 3 中,字节串(bytes)与文本字符串(str)被严格区分:bytes 仅表示原始二进制数据,不承载字符语义;而所有对象的默认字符串表示(如 str(None)、str([1,2]))返回的是 Unicode 字符串(str 类型)。因此,b’%s’ % obj 会失败——因为 %s 在字节串上下文中要求右侧操作数本身是 bytes 或实现了 __bytes__(),而 None、int、list 等内置类型并未(也不应)提供字节级格式化协议。

✅ 正确且推荐的做法是两步转换

  1. 使用字符串格式化获取人类可读的 Unicode 表示;
  2. 显式编码为所需字节序列。
# ✅ 推荐:先 str,再 encode >>> (str(None)).encode('utf-8') b'None' >>> ('%s' % 42).encode('utf-8') b'42' >>> f'{[1, "hello"]}'.encode('utf-8') b"[1, 'hello']"

⚠️ 注意编码选择:

  • 若数据确定只含 ASCII 字符(如纯数字、简单结构),可用 ‘ascii’ 编码,出错时快速暴露非 ASCII 内容:
    >>> str(['café']).encode('ascii')  # ❌ 抛出 UnicodeEncodeError
  • 更通用的场景应使用 ‘utf-8’(推荐默认):
    >>> str(['café', '∀', '?']).encode('utf-8') b"['ca\xc3\xa9', '\xe2\x88\x80', '\xf0\x9f\x91\x8d']"
  • 若需保证输出完全 ASCII 兼容(例如用于调试或日志传输),可使用 ascii() 函数或 %a 格式符,它自动转义非 ASCII 字符为 xXX、uXXXX 或 UXXXXXXXX 形式:
    >>> ascii(['café']).encode('ascii') b"['caf\xe9']" >>> ('%a' % {'name': '李华'}).encode('ascii') b"{'name': 'Li Hua'}"  # 实际输出含 \u674e\u534e,此处为简化示意

? 总结:Python 3 没有、也不需要“安装”字节串格式化器。这是语言设计的有意取舍——将文本抽象(str)与二进制数据(bytes)解耦,提升编码安全性与语义清晰度。迁移 Python 2 协议代码时,请统一采用 str(…).encode(encoding) 模式,并根据协议要求选择 ‘utf-8’、’latin-1’ 或 ‘ascii’ 编码。

立即学习Python免费学习笔记(深入)”;

text=ZqhQzanResources