如何在 Python 中递归展平嵌套的字典列表(含层级地址路径)

17次阅读

如何在 Python 中递归展平嵌套的字典列表(含层级地址路径)

本文介绍一种通用、可读性强的递归方法,将具有深层嵌套结构(如按地理层级展开的“国家/州/市/街道/房屋”)的字典列表展平为单一扁平列表,保留每个节点的关键字段(person、city、address、facebooklink),并自动继承完整路径。

在处理具有树状层级关系的数据(例如地理区域嵌套、组织架构或分类目录)时,常遇到类似如下结构:顶层对象包含基础字段(如 “person”、”address”),同时又以同名字段(如 “united states”、”ohio”)作为键,其值为子对象列表。这种设计虽利于语义表达,但不利于后续分析、导出或数据库存储——此时需将其递归展平为线性列表,使每一项代表一个独立实体(如一个人在某具体地址层级的信息)。

核心思路是:遍历每个字典,分离「普通字段」与「嵌套列表字段」。普通字段(字符串、数字等)直接保留;而值为 list 且所有元素均为 dict 的字段,则视为递归入口,对其子列表调用相同逻辑,并将结果合并到最终结果中。

以下是一个健壮、无第三方依赖的实现:

def flatten_objects(data):     """     递归展平嵌套字典列表。     假设结构特征:非列表值为原子字段(person, city, address...);                    列表值若全为字典,则为子层级,需递归处理。     """     result = []      # 支持输入为单个字典或字典列表     if isinstance(data, dict):         data = [data]      for item in data:         if not isinstance(item, dict):             continue          # 提取当前层级的原子字段(非列表,或列表但不全为字典)         base_fields = {}         nested_lists = []          for key, value in item.items():             # 若 value 是列表,且所有元素都是字典 → 视为嵌套层级             if isinstance(value, list) and all(isinstance(e, dict) for e in value):                 nested_lists.append(value)             else:                 base_fields[key] = value          # 当前层级有效数据必须至少含 person 或 address 等关键字段         if base_fields:             result.append(base_fields)          # 递归处理每个嵌套列表         for nested in nested_lists:             result.extend(flatten_objects(nested))      return result

使用示例

立即学习Python免费学习笔记(深入)”;

# 示例数据(已简化缩进便于阅读) nested_data = [     {         "person": "abc",         "city": "united states",         "facebooklink": "link",         "address": "united states",         "united states": [             {                 "person": "cdf",                 "city": "ohio",                 "facebooklink": "link",                 "address": "united states/ohio",                 "ohio": [                     {                         "person": "efg",                         "city": "clevland",                         "facebooklink": "link",                         "address": "united states/ohio/clevland",                         "clevland": [                             {                                 "person": "jkl",                                 "city": "Street A",                                 "facebooklink": "link",                                 "address": "united states/ohio/clevland/Street A",                                 "Street A": [                                     {                                         "person": "jkl",                                         "city": "House 1",                                         "facebooklink": "link",                                         "address": "united states/ohio/clevland/Street A/House 1"                                     }                                 ]                             }                         ]                     },                     {                         "person": "ghi",                         "city": "columbus",                         "facebooklink": "link",                         "address": "united states/ohio/columbus"                     }                 ]             },             {                 "person": "abc",                 "city": "washington",                 "facebooklink": "link",                 "address": "united states/washington"             }         ]     } ]  flattened = flatten_objects(nested_data) for i, obj in enumerate(flattened, 1):     print(f"{i}. {obj['person']} — {obj['city']} — {obj['address']}")

? 注意事项与最佳实践

  • 字段一致性保障:本方案不强制要求所有字典拥有完全相同的键,仅提取当前层级存在的字段,避免 KeyError。
  • ⚠️ 避免无限递归:确保嵌套结构为有向无环树(DAG),即不存在循环引用(如 A → B → A)。若存在,需额外加入 visited_ids 集合校验。
  • ? 扩展性提示:如需保留父级信息(如标注“所属州”),可在递归调用时传入 parent_path 或 ancestors 参数,动态构建字段。
  • ? 不推荐 flatten_json 库:flatten_json 设计目标是展平 键名(如转为 “a.b.c”: value),而非提取嵌套 值结构,在此场景下不适用,易导致语义丢失。

该方法简洁、可调试、零依赖,适用于任意深度的同类嵌套结构,是处理地理、分类、权限等树形 jsON 数据的理想起点。

text=ZqhQzanResources