Python如何遍历XML的同时获取父节点信息

11次阅读

最直接可靠的方式是使用lxml库的getparent()方法；标准库xml.etree.ElementTree需手动维护父关系，如递归传参或iterparse栈模拟，不推荐动态打补丁。

在python中遍历XML并同时获取父节点信息，最直接可靠的方式是使用 lxml 库的 getparent() 方法——标准库 xml.etree.ElementTree 默认不保存父引用，需手动维护或改用 lxml。

用 lxml 一键获取父节点

lxml 的 Element 对象原生支持 .getparent()，无需额外配置：

安装： pip install lxml
解析后任意节点调用 node.getparent() 即可返回其父元素（根节点返回 None）
支持 XPath、迭代、修改等完整功能，性能优于标准库

示例：

from lxml import etree  xml_str = "text" root = etree.fromstring(xml_str)  for elem in root.iter():     parent = elem.getparent()     print(f"标签: {elem.tag}, 父标签: {parent.tag if parent is not None else 'None'}")

用 xml.etree.ElementTree 手动构建父关系

如果必须用标准库，可通过递归遍历时显式传递父节点：

立即学习“Python免费学习笔记（深入）”；

不依赖外部包，适合轻量或受限环境
遍历时把当前节点作为参数传给子节点处理函数
避免后期反复查找父节点，逻辑清晰可控

示例：

import xml.etree.ElementTree as ET  def walk_with_parent(elem, parent=None):     print(f"当前: {elem.tag}, 父节点: {parent.tag if parent is not None else 'None'}")     for child in elem:         walk_with_parent(child, elem)  root = ET.fromstring("") walk_with_parent(root)

用 iterparse 遍历时缓存父栈（适合大文件）

处理超大 XML 时，iterparse 可边解析边处理，用栈模拟父子层级：

遇到 start 事件时将当前元素压栈，此时栈顶下一个是其父节点

遇到 end 事件时弹出，保持栈与实际嵌套深度一致

内存友好，适合 GB 级 XML 流式处理

示例关键逻辑：

stack = [] for event, elem in ET.iterparse("file.xml", events=("start", "end")): if event == "start": if stack: parent = stack[-1] print(f"{elem.tag} 的父节点是 {parent.tag}") stack.append(elem) elif event == "end": stack.pop()

不推荐：给 ElementTree 打补丁加 parent 属性

有人尝试通过 elem.parent = parent 动态赋值来“修复”标准库，但存在风险：

新创建的子元素（如用 SubElement）不会自动设 parent

复制、深拷贝、XPath 查找结果等场景 parent 关系易丢失

代码可维护性差，容易引发隐性 bug

除非有强约束不能引入第三方库，否则优先选 lxml 或递归传参方式。

发表于：web前端

2026-01-10

# app # bug # elif # node # pip # python # xml # 事件 # 对象 # 标准库 # 栈 # 递归

复制链接

mac上面怎么写html5_Mac系统HTML5开发工具链



css定位元素与overflow结合防止遮挡



如何在Golang中统一处理错误_Golang集中式错误处理方案



css grid 容器内子项高度不自适应怎么办_避免对子项设置固定高度

如何使用Golang实现云原生应用配置管理_集中控制和动态更新
上一篇

Golang使用context控制请求生命周期
下一篇

文章搜索

随机文章

JavaScript设计模式怎样提升代码质量【教程】

如何使用Golang测试序列化性能_Golang encoding/json Benchmark方法

如何在mysql中实现用户在线状态_mysql在线状态实现方案

如何在 Laravel 中使用 DISTINCT 去除数据库查询结果中的重复值

怎样处理javascript错误_try…catch语句如何使用【教程】

最新文章

Sublime如何查看十六进制文件_Sublime内置HexViewer用法【干货】

ethtool -S 显示 rx_no_buffer_count 持续增加的 rx ring buffer 增大经验

PHP后门怎么删除_异常进程占用高是否因后门作祟查法【汇总】

如何使用 inline-block 实现多个 div 的内联排列

systemd mount 单元启动失败显示 “dependency failed” 的 systemctl status 分析

标签云

.net @keyframes 12304 12306 2025 2025年 3a游戏 3d软件 500错误 7-zip access Accessors acfun actionscript activemq adb adobe adobe acrobat reader agi ai AIGC airpods ai大模型 ai工具 ai编程 ai芯片 ai视频 ajax alert algo币