PHP的XMLReader怎么用 pull解析器用法

23次阅读

xmlReader 是 php 中基于 Libxml 的只读、前向、低内存 XML Pull 解析器，适合处理大文件；通过 open()/XML() 加载源，read() 遍历节点，依 nodeType、name、value 等属性提取数据，并可结合 simpleXML 局部解析。

PHP 的 XMLReader 是一个基于 libxml 的**只读、前向、低内存占用的 XML Pull 解析器**，适合处理大文件或流式 XML 数据。它不构建 dom 树，而是逐个读取节点（如元素开始、结束、文本、属性等），由你控制解析流程。

基本用法：打开、遍历、读取节点

核心是创建实例 → 打开 XML 源（字符串、文件、URL）→ 循环调用 read() → 根据 nodeType 和属性判断当前节点类型并提取内容。

用 XMLReader::open($filename) 加载本地文件；用 XMLReader::XML($String) 加载字符串；支持 setParserProperty() 控制命名空间、空白处理等
read() 移动到下一个节点，返回 true 表示成功，false 表示结束或出错
常用属性：nodeType（常量如 XMLReader::ELEMENT、XMLReader::TEXT）、name（标签名）、value（文本内容）、depth（嵌套层级）

提取元素内容：区分开始标签、文本、结束标签

XMLReader 把一个 `

<a href="https://seo.sqjnqi.com/tag/php%e6%95%99%e7%a8%8b/"><b>php教程</b></a>` 拆成三个独立节点：`ELEMENT`（start tag）、`TEXT`（内容）、`END_ELEMENT`（end tag）。需按顺序识别才能正确获取值。

遇到 XMLReader::ELEMENT 且有子文本（即下一个是 TEXT），可先记下标签名，再调用一次 read() 取 value
更稳妥方式：用 isEmptyElement 判断是否自闭合；用 moveToFirstAttribute() + moveToNextAttribute() 遍历属性
示例逻辑：if ($reader->nodeType === XMLReader::ELEMENT && $reader->name === 'item') { $reader->read(); if ($reader->nodeType === XMLReader::TEXT) echo $reader->value; }

跳过无关节点 & 定位目标结构

实际 XML 常含空格、换行、注释、CDATA 等干扰节点。默认会读取所有，需主动过滤。

立即学习“PHP免费学习笔记（深入）”；

设置 $reader->setParserProperty(XMLReader::SUBST_ENTITIES, true) 展开实体（如 &）
跳过空白文本：if ($reader->nodeType === XMLReader::TEXT && trim($reader->value) === '') continue;
用 next($localName) 快速跳到下一个同名元素（例如跳到下一个 product），避免手动循环
用 readInnerXML() 或 readOuterXML() 获取当前节点及其子树的原始 XML 字符串（适合嵌套复杂结构）

配合 SimpleXML 或 DOM 做局部解析

XMLReader 本身不提供 XPath 或节点查找，但可以“定位”到某段 XML 后，转交其他扩展处理。

当 XMLReader 走到某个关键元素（如）时，调用 readOuterXML() 获取完整片段
再用 simplexml_load_string() 或 DOMDocument::loadXML() 解析该小段，享受 XPath、对象访问等便利
这样兼顾了内存效率（大文件靠 Reader 流式定位）和开发效率（局部用 SimpleXML 写逻辑）

发表于：php框架

2025-12-29

# continue # dom # echo # if # Libxml # node # php # php教程 # simpleXML # String # xml # 内存占用 # 命名空间 # 字符串 # 对象 # 常量 # 循环

复制链接

php怎样获取本机物理网卡ip_php过滤虚拟网卡取物理ip【技巧】

什么是javascript的Web Workers_为什么Web Workers能实现多线程

Firestore 文档检索性能对比：直接通过 ID 获取 vs 查询字段匹配

Golang责任链模式的应用场景_Golang责任链模式设计

Dart/Flutter怎么解析XML xml package用法

PHP的XMLReader怎么用 pull解析器用法

基本用法：打开、遍历、读取节点

提取元素内容：区分开始标签、文本、结束标签

跳过无关节点 & 定位目标结构

配合 SimpleXML 或 DOM 做局部解析

HTML和HTML5可访问性提升在哪_ARIA整合差异【提示】

C++ 模板特化是什么 C++ template全特化与偏特化详解【泛型】

加密货币如何入门交易？新手到进阶的实用操作指南

Go中panic会导致程序退出吗_Go运行时异常机制说明

如何为多维嵌套数组中的每个子元素动态添加 parent_id 字段

Composer怎么查看某个包的GitHub星数_Composer search详细信息【技巧】

c++如何进行单元测试_c++ gtest框架使用【指南】

不同浏览器运行HTML5小游戏为何表现不一_内核差异排查与统一方案【操作】

sublime怎么设置显示所有的制表符_Sublime空白字符显示【方法】

Flask 中异步训练模型后无法重定向到结果页面的解决方案