Python怎么解析XML文件 ElementTree使用方法

16次阅读

python解析xml最常用方式是标准库xml.etree.ElementTree（ET），支持文件/字符串加载、元素遍历查找、属性文本获取、修改保存，轻量且无需额外安装。

Python 解析 XML 文件最常用、最轻量的方式就是用标准库里的 xml.etree.ElementTree（常简写为 ET）。它简单直接，适合大多数日常解析需求，不需要额外安装包。

ElementTree 支持从文件路径读取，也支持解析字符串内容：

从文件加载：tree = ET.parse('data.xml')，返回 ElementTree 对象，再用 tree.getroot() 获取根元素
从字符串解析：root = ET.fromstring(xml_string)，直接返回根 Element

注意：如果 XML 编码不是 UTF-8，且文件里没声明编码（如），用 parse() 可能报错，这时建议先用 open(..., encoding='gbk') 读成字符串再传给 fromstring()。

每个 Element 就是一个节点，有 tag（标签名）、text（开始标签和子节点之间的文本）、tail（子节点之后的文本）等属性。

XML 元素的属性（如）要通过 .get('id') 或 .attrib['id'] 获取；文本内容则用 .text（注意：它不包含子元素内的文本）。

elem.get('id', 'default') 安全获取属性，缺失时返回默认值
如果想提取完整文本（含子元素内容），可用 ET.tostring(elem, encoding='unicode', method='text')，但一般推荐手动拼接或用 elem.itertext()
list(elem.itertext()) 返回生成器，可遍历所有文本片段（包括子节点中的）

ElementTree 不仅能读，还能改写。修改后调用 tree.write() 保存回文件：

基本上就这些 —— 不复杂但容易忽略细节，比如 text 和 tail 的区别、属性获取的安全写法、以及中文编码处理。用熟了，解析配置、日志、简单数据交换都够用。

发表于：开发工具

2026-01-13

复制链接

Composer提示 “Your configuration does not allow connections to…” 怎么办？ (secure-http设置)

VSCode如何与GitHub Codespaces协同工作？