Rust语言怎么解析XML quick-xml库

30次阅读

quick-xml解析XML在rust中高效，事件驱动（Reader）适合流式/大文件，结构化反序列化（de::from_str）适合已知结构；需按需启用features，注意编码、命名匹配与内存控制。

用 quick-xml 解析 XML 在 Rust 中很高效，核心是选择合适的 API 模式：事件驱动（Reader）适合流式、大文件或自定义逻辑；结构化反序列化（de::from_str）适合已知结构、追求简洁。

快速上手：用 Reader 做事件驱动解析

quick-xml 的 Reader 类型以迭代方式暴露 XML 事件（开始标签、文本、结束标签等），内存占用低，控制粒度细。

添加依赖到 Cargo.toml：
quick-xml = { version = "0.32", features = ["encoding"] }
基础读取示例（跳过空白、提取所有 <item></item> 的 name 文本）：

use quick_xml::events::BytesStart; use quick_xml::Reader;  let xml = r#" <root>   <item id="1"><name>apple</name></item>   <item id="2"><name>Banana</name></item> </root>"#;  let mut reader = Reader::from_str(xml); reader.trim_text(true); // 自动忽略纯空白文本节点  let mut buf = Vec::new(); let mut names = Vec::new();  loop {     match reader.read_event_into(&mut buf) {         Ok(quick_xml::events::BytesEvent::Start(ref e)) if e.name().as_ref() == b"name" => {             // 下一个事件应为 Text             match reader.read_event_into(&mut buf) {                 Ok(quick_xml::events::BytesEvent::Text(e)) => {                     names.push(e.unescape_and_decode(&reader).unwrap_or_default());                 }                 _ => {}             }         }         Ok(quick_xml::events::BytesEvent::Eof) => break,         _ => {}     }     buf.clear(); } // names == ["apple", "Banana"]

结构化解析：用 serde 反序列化成 Rust 结构体

如果你的 XML 格式固定，推荐用 serde + quick-xml 的 de::from_str，写法接近 jsON 解析，更直观。

趣问问AI

免费可用的国内版chat，AI写作和AI对话

97

查看详情

启用 serde 功能：
quick-xml = { version = "0.32", features = ["serialize"] }
定义结构体并标注 #[derive(Deserialize)]，注意字段名与 XML 标签名/属性名匹配：

use serde::Deserialize;  #[derive(Deserialize, Debug)] struct Item {     #[serde(rename = "@id")] // @ 表示属性     id: u32,     name: String, }  #[derive(Deserialize, Debug)] struct Root {     #[serde(rename = "item")]     items: Vec<Item>, }  let xml = r#" <root>   <item id="1"><name>Apple</name></item>   <item id="2"><name>Banana</name></item> </root>"#;  let root: Root = quick_xml::de::from_str(xml).unwrap(); // root.items[0].id == 1, root.items[0].name == "Apple"

处理命名空间和 CDATA

默认情况下 quick-xml 不自动解析命名空间前缀，需手动配置 Reader::with_config 启用；CDATA 内容会被当作普通文本，但可通过 BytesEvent::CData 事件单独捕获。

启用命名空间支持（需开启 features = ["encoding", "namespaces"]）：
let mut reader = Reader::from_str(xml).with_config(ReaderConfig::default().trim_text(true).check_namespace(true));
识别 CDATA：
在 read_event_into 循环中匹配 BytesEvent::CData(e)，然后用 e.unescape_and_decode(&reader) 获取内容。

常见陷阱与建议

避免运行时 panic 或解析失败，注意以下几点：

XML 编码需与实际一致（如 UTF-8），否则 unescape_and_decode 可能失败；可先用 std::str::from_utf8 验证输入
反序列化时字段名不匹配（大小写、下划线、属性 vs 元素）会导致静默跳过或报错，建议开启 #[serde(default)] 或 #[serde(default = "...")] 处理缺失字段
嵌套过深或递归结构容易栈溢出，大文件优先用 Reader 流式处理，避免一次性加载整个树
如果需要修改或生成 XML，用 Writer 而非手动拼接字符串

发表于：后端开发

2025-12-24

# app # apple # default # go # js # json # rust # xml # xml解析 # 事件 # 内存占用 # 命名空间 # 字符串 # 循环 # 栈 # 结构体 # 编码 # 递归

复制链接

c++中reinterpret_cast用在什么场景_c++类型转换reinterpret_cast解析

css 元素透明度设置后文字也透明怎么办_使用 rgba 背景色替代 opacity

Go语言实现最长公共子序列（LCS）回溯：深度解析与正确实践

高效列出 Python 中 Parquet 文件分区的方法

c++中的数据驱动设计是什么_c++游戏开发与数据分离

Rust语言怎么解析XML quick-xml库

快速上手：用 Reader 做事件驱动解析

结构化解析：用 serde 反序列化成 Rust 结构体

处理命名空间和 CDATA

常见陷阱与建议

where子句在sql中如何使用_mysql条件语法理解

css content box 模式适合什么场景_从盒模型尺寸可控性角度解释

币圈巨额砸盘是什么意思币圈巨额砸盘是啥意思

IFTTT/Zapier如何创建一个“当邮件收到XML附件时上传到Dropbox”的自动化

php函数怎么piso新手入门_从定义到简单调用快速学【指南】

Linux 磁盘扩容后容量未生效的原因

CSS过渡的隐式触发_理解属性从无到有时动画失效的原因

Laravel怎么生成API文档_Laravel集成Swagger/Scribe教程【必备】

PHP如何替换压缩包里的文件_ZIP内容修改操作【指南】

Linux 服务健康检查机制设计