Python 内置类型缓存机制详解

10次阅读

小整数（-5~256）和短字符串能用 is 比较，因 Cpython 预缓存这些对象，字面量赋值时指向同一内存；但该行为不跨实现/版本保证，应优先用 == 判断相等，is 仅用于身份比较（如 is None）。

Python 内置类型缓存机制详解

小整数和短字符串为什么能用 `is` 比较？

因为 Python 对一部分内置对象做了「缓存复用」，不是每次创建都分配新内存。比如 -5 到 256 的整数、长度较短的标识符风格字符串（如 "hello"），解释器启动时就预创建好并放进全局缓存池。所以 a = 100; b = 100; a is b 返回 True —— 它们指向同一对象。

但这个行为只适用于 CPython 实现，且不保证跨版本一致；更关键的是，它仅在「字面量直接赋值」或「编译期可确定」的场景生效。比如：

a = 1000 b = 1000 a is b # 可能为 False（超出小整数范围） s1 = "hello world" s2 = "hello world" s1 is s2 # 通常为 True（短字符串驻留）

s3 = "hello" + " " + "world" # 编译期拼接，仍驻留 s4 = "hello world" * 1 # 运行时计算，通常不驻留

不要依赖 is 判断数值或字符串相等，一律用 ==
字符串驻留（interning）受 sys.intern() 控制，也受编译器优化影响，不能当作稳定特性使用
is 应仅用于判断是否为同一个对象（如 obj is None）

`id()` 和 `is` 在缓存对象上的表现一致性

id() 返回对象在内存中的地址（CPython 中是实际指针值），而 is 的语义就是 id(a) == id(b)。所以只要两个变量指向缓存池里的同一个预分配对象，id() 就必然相同，is 也返回 True。

但注意：缓存对象一旦被垃圾回收（极罕见，因缓存池对象生命周期与解释器一致），其 id 可能被后续新对象复用 —— 所以 id 值本身不可持久化存储或跨时间比较。

立即学习“Python免费学习笔记（深入）”；

缓存对象的 id 在整个程序运行期间稳定，但仅限于该对象存活期内
不要把 id() 当作唯一标识符用于序列化、日志追踪等场景
is 的结果可预测，id() 的数值含义仅对当前运行实例有效

哪些类型有缓存？哪些没有？

CPython 明确实现缓存的主要是：

小整数：-5 至 256（含），定义在 Objects/longobject.c 中的 small_ints 数组
单字符字符串：所有 ASCII 字母、数字、下划线（即符合标识符首字符规则的单字符）
部分短字符串：编译期常量、无空格/特殊字符的短串（如 "__name__"），由编译器触发 PyUnicode_InternInPlace

以下类型**没有**内置缓存机制：

浮点数（1.0 is 1.0 为 True 是巧合，源于编译器常量折叠，非缓存）
列表、字典、集合等可变类型（即使内容相同，每次 [] 都新建对象）
长字符串（如 "a" * 1000）、含空格或 Unicode 的字符串（除非显式 sys.intern()）
自定义类实例（无论 __eq__ 如何实现，is 总是 False）

缓存机制对性能和内存的实际影响

缓存本质是空间换时间：避免重复分配、减少 GC 压力、加快对象创建。对小整数来说，效果显著——每秒百万级的 int 创建几乎零开销；对字符串驻留，则大幅降低字典键查找时的哈希与比较成本（尤其在大量重复 key 的场景，如 jsON 解析）。

但副作用也很明确：

启动时多占几 KB 内存（小整数池约 312 个对象，字符串驻留表初始为空，随需增长）
驻留字符串会阻止其被回收，哪怕只在局部作用域短暂使用过
过度依赖驻留可能掩盖逻辑错误（例如误用 is 导致测试通过但线上失败）

真正需要干预缓存行为的场景极少。如果确实要控制字符串驻留，用 sys.intern() 即可，但必须确保传入的是不可变字符串，且调用时机在首次创建后、被其他引用持有前。

发表于：后端开发

2026-01-27

# ASCII # go # int # js # json # python # 为什么 # 作用域 # 字符串 # 对象 # 常量 # 持久化存储 # 指针 # 标识符 # 风格字符串

复制链接

怎么把源码转换php_把源码转换为php格式与适配法【教程】

如何在Golang中使用encoding/base64进行编码解码_Golang encoding/base64编码解码方法汇总

c++中指针是什么意思_介绍C++中指针概念及常见用法

Golang如何检测并发中的数据竞争

如何利用vscode的文件比较功能合并代码差异【教程】

Python 内置类型缓存机制详解

小整数和短字符串为什么能用 `is` 比较？

`id()` 和 `is` 在缓存对象上的表现一致性

哪些类型有缓存？哪些没有？

缓存机制对性能和内存的实际影响

欧易OKX最新备用官网域名入口 OKX官方交易所App v7.0.2安卓与iOS下载

css 使用多个 link 标签是否合理_通过合并样式减少请求数

币安2026年最新官网链接币安Binance App v9.3.0正版安装包获取

SQL 从“能用”到“稳定可控”的演进

如何让 Go 的 HTTP 请求绕过网站的反爬与防火墙检测

如何在 Go 中确保 JSON 反序列化后 map 的键顺序一致？

Go 中字符串减法运算的正确替代方案

Laravel 9+ 中 AJAX 请求的 CSRF Token 管理最佳实践

Linux 灰度发布过程中的风险控制

TypeScript 中 keyof 在嵌套映射类型中的误用与正确实践

Python 内置类型缓存机制详解

小整数和短字符串为什么能用 is 比较？

id() 和 is 在缓存对象上的表现一致性

哪些类型有缓存？哪些没有？

缓存机制对性能和内存的实际影响

小整数和短字符串为什么能用 `is` 比较？

`id()` 和 `is` 在缓存对象上的表现一致性