Python list 的扩容机制与性能影响

12次阅读

python list通过预留空间和动态倍增策略实现扩容：小列表（n

Python list 是如何动态扩容的

Python 的 list 底层用的是 C 数组，但支持动态增删，靠的是「预留空间 + 倍增策略」。每次 append() 时，如果当前容量不够，解释器会分配一块更大的内存（通常是当前容量的 1.125 倍左右），把旧数据拷过去，再追加新元素。

这个倍增系数不是固定 2，而是按当前长度动态计算：当长度 n 时，新容量 = n + 8；当 n >= 64 时，新容量 = n + n // 8（即约 1.125×）。这样既减少小列表的浪费，又避免大列表频繁 realloc。

扩容是 amortized O(1)，但单次 append() 可能触发 O(n) 拷贝
extend() 批量添加时，也会按目标长度预估并一次性扩容，比循环 append() 更快
用 list *= 2 或 list += [x] * n 不会触发多次扩容，因为 Python 能静态推断最终长度

什么时候扩容会拖慢你的代码

高频小量追加（比如在循环里反复 append() 十万次）看似简单，实际可能触发几十次内存分配和拷贝。尤其当列表从空开始增长时，前几轮扩容虽快，但到几万规模后，每次拷贝几百 KB 甚至 MB 数据，延迟就明显了。

典型陷阱：result = [] 然后 for x in data: result.append(transform(x)) —— 如果 data 很大，不如先 result = [None] * len(data) 预分配
insert(0, x) 强制所有已有元素右移，是 O(n) 操作，且几乎每次都会触发扩容（因为头部插入不利用预留空间）
pop(0) 同样要左移，性能差；应改用 collections.deque 处理队列场景

如何观察和验证扩容行为

不能只看 len(my_list)，得看底层分配容量——用 sys.getsizeof() 粗略估算内存占用，或更准地用 Array.array 对比，但最直接的是调用 list.__sizeof__() 加上指针开销，不过生产中推荐用 sys.getsizeof() 辅助判断。

更实用的方法是监控 id() 和 len() 变化：

import sys l = [] for i in range(100):     old_id = id(l)     l.append(i)     if id(l) != old_id:         print(f"len={len(l)-1} → {len(l)}, size={sys.getsizeof(l)} bytes")

输出会显示扩容发生的临界点（如 0→1、1→2…直到 64→72、72→81…）
sys.getsizeof() 返回的是对象总内存，包括容器本身和指向元素的指针数组，不包括元素内容（如字符串对象另算）
注意：CPython 实现细节，PyPy 或其他解释器策略不同，别依赖绝对数值

预分配和替代方案的实际取舍

预分配不是银弹。如果你根本不知道最终长度（比如流式处理、条件过滤），硬写 [None] * estimated_max 可能浪费内存，甚至因估计过大导致 OOM。

确定长度 → 用 [None] * n 或 array.array('i', [0]) * n（更省内存）
不确定长度但追求速度 → 用 list.extend() 替代循环 append()，或考虑生成器表达式 + list()
频繁首尾增删 → 切换为 collections.deque，它用双向链表块实现，无扩容问题
纯数值计算 → array.array 或 numpy.ndarray 更紧凑，且扩容逻辑完全不同（通常不允许动态增长）

真正影响性能的往往不是扩容本身，而是你没意识到它正在发生——尤其是在嵌套循环、回调函数或日志聚合这类“看起来很轻”的场景里。

发表于：后端开发

2026-01-29

复制链接

如何在 Go 中正确解析命令行 IP 地址参数

C++对象生命周期与内存分配关系

如何安装php网站分析工具_用户行为分析与流量统计配置方法

c++中如何实现延时或睡眠_C++程序延时与线程休眠方法

c# 异步流 IAsyncEnumerable 的实现原理

Python list 的扩容机制与性能影响

Python list 是如何动态扩容的

什么时候扩容会拖慢你的代码

如何观察和验证扩容行为

预分配和替代方案的实际取舍

C# Dapper多结果集查询方法 C#如何使用QueryMultiple一次执行多条查询

SVG 中 rect 元素应用 filter 后圆角失效的解决方案

构建跨平台教育类应用（如Duolingo）的最佳编程语言与框架选择

chrony/ntpd 在 K3s 节点上失效导致时间漂移的修复经验

如何在 WordPress ACF 中正确输出包含 HTML 标签的字段内容

Linux falco 的 –modern-bpf 与 classic probe 的性能与兼容性对比

Laravel怎么使用集合Collection_Laravel处理数组数据的常用函数【技巧】

使用智能手机加速度计精确计算行走距离的可行性与替代方案分析

Laravel怎么集成Markdown编辑器_Laravel后台内容管理系统【插件】

css如何在flex中控制元素对齐方式_结合justify-content和align-items