python处理xml最常用xml.etree.ElementTree(ET),轻量易用、标准库自带;支持解析、查找、遍历、修改和构建XML,自动处理转义。

Python处理XML最常用的是内置的xml.etree.ElementTree(简称ET),它轻量、易用、标准库自带,适合大多数日常解析与生成任务。
快速上手:解析和查找元素
ElementTree把XML转成树状结构,根节点是Element对象,子节点用.find()、.findall()或XPath简写(如.find('book/title'))定位。支持直接遍历子元素:for child in root:。
- 用
ET.parse("file.xml")加载文件,或ET.fromstring(xml_str)解析字符串 -
elem.text获取文本内容,elem.attrib获取属性字典 - 修改后调用
tree.write("out.xml", encoding="utf-8", xml_declaration=True)保存
构建新XML:比字符串拼接更安全可靠
不用手动拼标签和转义,用ET.Element()、ET.SubElement()逐层创建,自动处理特殊字符(如&、)和编码。
- 设置属性用
elem.set("name", "value"),设文本用elem.text = "text" - 支持嵌套添加:
sub = ET.SubElement(parent, "item") - 生成的XML默认不带换行缩进,如需美化可配合
xml.dom.minidom或第三方库lxml
ElementTree的核心优势
不是功能最多,而是“够用、顺手、无依赖”。相比lxml或xml.sax,它在简洁性和实用性之间平衡得最好。
立即学习“Python免费学习笔记(深入)”;
- 零安装成本:Python 2.5+ 自带,无需pip install
- API直观:方法名贴近直觉(
find、iter、remove),学习门槛低 - 内存友好:相比DOM类解析器,对中小型XML足够高效;虽不如SAX流式节省内存,但开发效率高得多
- 足够健壮:能处理常见命名空间(用
{uri}tag语法)、注释、CDATA等,满足90%业务场景
基本上就这些。真遇到超大XML、复杂XPath或XSLT需求,再考虑lxml;日常配置读写、接口数据交换、简单报表生成,ElementTree完全够用又省心。