Python ORM 中描述符的典型应用

1次阅读

sqlalchemy中__get__返回none是因为未区分类访问与实例访问:obj is none时应返回描述符自身,否则类访问(如user.name)会出错;正确做法是if obj is none: return self。

Python ORM 中描述符的典型应用

为什么 __get__ 在 SQLAlchemy 模型里总返回 None

因为没区分实例访问和类访问——描述符的 __get__ 第二个参数 objNone 时,说明是通过类(如 User.name)访问的,不是通过实例(如 user.name)。SQLAlchemy 的列对象正是靠这个区分“取值”和“取 column 对象本身”。

实操建议:

立即学习Python免费学习笔记(深入)”;

  • 在自定义描述符中,if obj is None: return self 是安全兜底,否则类访问会出错或返回意外值
  • SQLAlchemy 的 Column 就是这么做的:类访问返回 Column 实例,实例访问才触发数据库字段读取逻辑
  • 如果忘了判 obj,调试时看到 User.name 返回 None,大概率是描述符直接返回了未初始化的内部属性

hybrid_property 和普通描述符混用时报 AttributeError: 'xxx' Object has no attribute 'y'

混合属性(hybrid_property)底层也是描述符,但它会尝试在实例和类两个层面都工作。一旦你在它的 @xxx.expression 方法里引用了实例才有的属性(比如 self._cached_value),SQL 查询时就会崩——因为 ORM 构建 SQL 表达式阶段根本没有实例。

实操建议:

立即学习Python免费学习笔记(深入)”;

  • @xxx.expression 里只能用 cls(即模型类)和 SQLAlchemy 的表达式构造函数,比如 func.lower(cls.name)
  • 不要在 expression 方法里写 self.xxx 或调用实例方法
  • 如果需要运行时逻辑,拆成两个路径:实例访问走描述符逻辑,查询过滤走 expression,二者不共享状态

django Model 中手动写描述符,结果 save() 不触发字段更新

Django 的字段更新检测依赖 Field.pre_save()Model._meta.get_field() 机制,它根本不会查你写的描述符。你用 __get__/__set__ 拦截了属性访问,但 Django 序列化、脏字段检查、SQL 生成全绕过了你。

实操建议:

立即学习Python免费学习笔记(深入)”;

  • 想影响保存行为,优先用 Field.pre_save() 或重写 Model.save(),别靠描述符“偷偷改值”
  • 如果真要用描述符(比如封装计算逻辑),确保它只读(__set__AttributeError),并另配一个真实 Field 存储数据
  • 常见坑:描述符里 __set__ 直接赋值给 self._value,但 save() 时 Django 根本不知道这个字段该写进 SQL

用描述符实现缓存时,__dict__ 覆盖和线程安全怎么处理

描述符缓存常写成 “查 instance.__dict__ → 没有就计算并塞进去”,但有两个现实问题:一是其他代码可能直接往 __dict__ 写同名 key 覆盖缓存;二是多线程下计算可能重复执行。

实操建议:

立即学习Python免费学习笔记(深入)”;

  • 缓存 key 建议加前缀,比如 _cache_{name},降低被误写风险
  • 简单场景用 functools.cached_propertypython 3.8+),它自带线程锁和命名空间隔离
  • 自己实现时,避免直接操作 instance.__dict__,改用 setattr(instance, '_my_cache', value),更可控
  • 注意:cached_property 是实例级的,不能用于类属性或 @classmethod

Django 和 SQLAlchemy 对描述符的支持路径完全不同,别试图写一个描述符通吃两边;更关键的是,ORM 本身已经重度使用描述符,你的自定义逻辑很容易和它们的生命周期冲突。

text=ZqhQzanResources