Python 对象 ID 与内存地址的对应关系

9次阅读

id()返回对象在生命周期内的唯一标识,在Cpython中是PyObject*地址转成的整数,但非标准内存地址;小整数(-5~256)和部分字符串会被缓存导致相同id,可变对象就地修改id不变,新建则变。

Python 对象 ID 与内存地址的对应关系

Python 中 id() 返回的到底是不是内存地址

是,但不是你 C 语言里理解的那种“裸指针地址”。id() 在 CPython 实现中确实返回对象在内存中的地址(即 PyObject* 指针值),但它被强制转换为一个整数,且该整数只保证在对象生命周期内唯一。不同 Python 实现(如 PyPy、Jython)不承诺这个值是真实内存地址——所以不能跨实现依赖它的数值含义。

常见误解:看到 id(obj) 是个大整数(比如 140234567890128),就以为能用它做指针运算或传给 C 扩展当地址用。实际上,CPython 内部做了对齐和偏移处理,直接 reinterpret_cast 是危险的。

为什么两个相同值的不可变对象可能有相同 id()

因为 CPython 对小整数和短字符串做了对象缓存(interning)。例如:

>>> a = 42 >>> b = 42 >>> id(a) == id(b) True >>> a is b True

这不是巧合,而是优化行为。但仅限于特定范围:

立即学习Python免费学习笔记(深入)”;

  • 小整数:通常 -5256(CPython 源码中定义为 NSMALLPOSINTSNSMALLNEGINTS
  • 字符串:仅当由编译器静态确定、不含空格/特殊字符、长度较短时可能被 intern —— 但运行时拼接的字符串(如 "a" + "b")一般不会自动 intern
  • 浮点数、元组等不参与此缓存

可变对象的 id() 何时会变

id() 只在对象被销毁重建时改变。对可变对象来说,只要没被 del 或失去所有引用,即使内容变了,id() 也保持不变:

>>> lst = [1, 2] >>> original_id = id(lst) >>> lst.append(3) >>> id(lst) == original_id True

但要注意这些陷阱:

  • 赋值语句如 lst = lst + [4] 创建了新列表,id() 必然变化(因为 + 返回新对象)
  • lst += [4] 是就地修改,id() 不变(调用的是 __iadd__
  • 使用 copy.copy()切片 lst[:] 都会生成新对象,id() 不同

想真正看内存布局?别只信 id()

id() 是调试辅助工具,不是内存分析接口。如果真要验证对象位置或观察内存复用,推荐:

  • ctypes.addressof() 查看 ctypes 对象地址(需先转成 ctypes.py_object
  • sys.getsizeof() 看对象本身占用字节数(不含引用对象)
  • gc.get_objects() 配合 id() 追踪存活对象,但注意性能开销大
  • 在 CPython 源码中查 Objects/object.c_Py_NewReference 实现,确认地址分配逻辑

最常被忽略的一点:id() 值在对象被回收后可能被新对象重用 —— 所以拿旧 id() 去查当前内存,大概率指向无关数据。

text=ZqhQzanResources