bytearray vs bytes 的可变性导致的常见内存拷贝陷阱

10次阅读

bytearray可原地修改且复用内存，bytes不可修改；操作时应预估大小、用extend()拼接、注意传参副作用及转换开销。

修改 `bytearray` 不会触发新对象分配，`bytes` 一改就报错

这是最直接的差异：你不能对 bytes 做任何原地修改——哪怕只是改一个字节，python 就立刻抛 TypeError: 'bytes' Object does not support item assignment。而 bytearray 允许 ba[0] = 65、ba.append(98)、del ba[-1] 这类操作，全程复用同一块内存地址。

实操建议：

用 id() 对比验证：id(ba) 在多次修改后不变；id(b) 和 id(b.replace(...)) 一定不同
别用 bytes 接收网络流或文件缓冲区后再“加工”——它强制你每次操作都拷贝整段数据
如果只是读取+解码（如 b'hello'.decode()），bytes 更轻量；但凡要拼接、截断、填充、加校验位，优先选 bytearray

`bytearray` 拼接时用 `extend()`，别用 `+=` 或 `+`

+= 看似是原地操作，但在 bytearray 上它其实等价于 __iadd__，底层仍可能触发隐式拷贝（尤其当预留空间不足时）。而 extend() 明确走扩容+复制路径，行为更可控。

常见错误现象：

循环中反复 ba += b'x00' → 内存分配次数随长度线性增长，性能暴跌
用 ba = ba + other_ba → 创建全新 bytearray，旧对象被丢弃，GC 压力增大

正确做法：

初始化时预估大小：ba = bytearray(4096)，再用 ba[:n] = ... 填充
拼接多个片段用 ba.extend(other)，支持 bytes、bytearray、list（元素为 0–255 整数）
确认是否真需要拼接：有时用 memoryview(ba) 切片访问，比复制更省

传参时小心“假装可变”的陷阱：函数内 `bytearray` 修改会反映到调用方

因为 bytearray 是可变对象，传入函数后，你在函数里 ba.append() 或 ba[0] = 1，调用方看到的就是被改过的原对象——不像 bytes 那样天然隔离。

容易踩的坑：

写工具函数时没加防御性拷贝：def encrypt_inplace(data): data[:] = ... → 调用者原始数据被意外覆盖
多线程/协程共享同一个 bytearray 缓冲区 → 竞态修改导致数据错乱（它不是线程安全的）
误以为 ba.copy() 是深拷贝 —— 实际只是浅拷贝（新对象，但内容独立），这点比 list.copy() 更易混淆

建议：

函数文档明确标注是否修改入参
不确定时，开头加 if not isinstance(data, bytearray): data = bytearray(data) 或 data = data.copy()
高并发场景下，用 threading.local() 绑定私有缓冲区，别复用全局 bytearray

从 `bytes` 创建 `bytearray` 的开销不可忽略

看似只是一次转换：ba = bytearray(b)，但背后是完整内存拷贝——哪怕 b 有 10MB，这一步就要额外分配 10MB 并逐字节复制。

性能影响明显的情况：

高频小包处理（如 websocket 帧解析），每次收包都 bytearray(recv_bytes) → CPU 和内存带宽成瓶颈
用 bytes 作缓存键（如 cache[b]），又频繁转成 bytearray 修改 → 双重浪费

优化方向：

源头控制：让 I/O 层直接返回 bytearray（如 socket.recv_into(bytearray)）
避免无谓转换：能用 memoryview(b) 切片访问的，就不转 bytearray
批量处理时，先收集所有 bytes 片段，再一次性构造大 bytearray，而非逐个转

真正麻烦的不是“能不能改”，而是“谁在什么时候悄悄改了”。bytearray 的可变性像一把没鞘的刀——用得好省资源，握得松就割手。尤其在底层协议解析、二进制打包、零拷贝优化这些地方，多看一眼 id() 和内存占用曲线，比背十遍文档管用。

发表于：后端开发

2026-01-24

# app # append # copy # if # Object # python # websocket # 内存占用 # 切片 # 多线程 # 字节 # 对象 # 工具 # 并发 # 循环 # 线程

复制链接

php怎么获取内存使用情况_php查看内存占用函数

php怎么下载安装后修改上传临时目录_路径配置说明【解答】

应对PEP 668：在Linux发行版中高效管理用户Python环境

.NET中的并发集合：线程安全的数据结构使用指南

IFTTT/Zapier如何创建一个“当邮件收到XML附件时上传到Dropbox”的自动化

bytearray vs bytes 的可变性导致的常见内存拷贝陷阱

修改 `bytearray` 不会触发新对象分配，`bytes` 一改就报错

`bytearray` 拼接时用 `extend()`，别用 `+=` 或 `+`

传参时小心“假装可变”的陷阱：函数内 `bytearray` 修改会反映到调用方

从 `bytes` 创建 `bytearray` 的开销不可忽略

Go 中接口实现与指针接收器的正确用法详解

如何在VSCode中使用Emmet快速编写HTML？【教程】

如何使用Composer管理Magento 2项目的复杂依赖？ (最佳实践)

mysql如何使用别名_mysql as关键字使用方法

KuCoin虚拟币交易平台官方网址入口 KuCoin交易所账户注册及登录流程

Matlab读取XML文件 Matlab解析XML节点属性

css如何使用Sass函数提高样式复用性_利用函数简化样式编写

Apache如何启用PHP的错误日志_将PHP错误记录到指定文件的操作【指南】

WooCommerce 限制未登录用户仅购买指定分类下的一个商品（免注册场景）

如何为特定 ID 的按钮自定义 ::after 伪元素悬停背景色

bytearray vs bytes 的可变性导致的常见内存拷贝陷阱

修改 bytearray 不会触发新对象分配，bytes 一改就报错

bytearray 拼接时用 extend()，别用 += 或 +

传参时小心“假装可变”的陷阱：函数内 bytearray 修改会反映到调用方

从 bytes 创建 bytearray 的开销不可忽略

修改 `bytearray` 不会触发新对象分配，`bytes` 一改就报错

`bytearray` 拼接时用 `extend()`，别用 `+=` 或 `+`

传参时小心“假装可变”的陷阱：函数内 `bytearray` 修改会反映到调用方

从 `bytes` 创建 `bytearray` 的开销不可忽略