Python list 扩容机制是怎样的?

9次阅读

python列表底层用动态数组实现,扩容在len(list)==allocated_capacity时触发,采用渐进式增长策略:小列表+4、中等列表×1.125、大列表+1/6,且不因pop缩容。

Python list 扩容机制是怎样的?

Python 列表(list)底层是用动态数组实现的,扩容不是每次 append 都发生,而是采用“预留空间 + 增量扩容”策略,兼顾时间效率和内存开销。

扩容触发条件

当执行 append()insert() 等操作导致当前元素数量超过已分配容量时,解释器会自动扩容。核心判断逻辑是:

  • len(list) == allocated_capacity 时触发扩容
  • 不因 pop()切片等操作缩容(缩容需手动调用 del 或重建)

扩容倍数与增长公式

CPython 实现中,新容量按以下规则计算(非固定倍数,而是渐进式增长):

  • 小列表(当前 size
  • 中等列表(9 ≤ size
  • 大列表(size ≥ 500):新 capacity = old capacity + old capacity // 6(约 1.167 倍)

例如:[0]*64 后再 append 一次,capacity 会变成 72;继续追加到 72 个元素时,下一次扩容会升到 81 左右。

立即学习Python免费学习笔记(深入)”;

内存预分配与 over-allocation

扩容时实际申请的内存比所需元素数略多,这种“over-allocation”是为了减少频繁 realloc。你可以通过 sys.getsizeof()len() 对比观察:

  • l = []:初始 capacity 通常为 0 或 4(版本相关)
  • l = [1,2,3]len(l) 是 3,但 sys.getsizeof(l) 显示它占了约 80–104 字节,说明已有冗余空间

如何查看和控制容量?

Python 不提供直接访问 capacity 的接口,但可通过间接方式估算:

  • sys.getsizeof(l) 减去基础对象开销(约 56 字节),再除以指针大小(64 位系统为 8 字节),可粗略反推已分配 slot 数
  • 想最小化内存浪费?批量初始化时用 [None] * nlist(range(n)),避免多次 append 触发多轮扩容
  • 若明确知道最终长度且需频繁修改,考虑用 Array.arraynumpy 数组替代
text=ZqhQzanResources