html5用xpath查询xml_定位深层节点的表达式编写方法【说明】

14次阅读

必须先用domParser解析xml字符串为XMLDocument,再调用其evaluate()方法执行XPath查询;直接在html文档中对XML字符串使用document.evaluate()会因HTML解析规则导致失败。

html5用xpath查询xml_定位深层节点的表达式编写方法【说明】

document.evaluate()html5 中查 XML 文档必须先解析为 XMLDocument

直接在 HTML 文档里对 XML 字符串用 document.evaluate() 会失败——浏览器把 XML 当成普通 HTML 解析,标签名被小写化、自闭合标签被补全,//book/title 这类表达式根本找不到节点。必须先用 DOMParser 解析成独立的 XMLDocument 实例。

  • DOMParserparseFromString() 第二个参数必须是 "application/xml""text/xml",用 "text/html" 就白解析了
  • 解析后得到的是 XMLDocument,它的 evaluate() 才支持标准 XPath 功能(比如轴、谓词、命名空间
  • HTML 文档自身的 documentHTMLDocument,不保证支持 XPath 轴如 ancestor:: 或函数如 local-name()

/// 在深层嵌套 XML 中的行为差异

// 是 descendant-or-self 轴的简写,会递归搜索所有层级;/ 是绝对路径起点,必须从根节点开始严格匹配。写错一个斜杠,结果可能全空。

  • XML 根节点是 ,里面有
    ...

    ,想定位所有作者:用 //author 可以,但 /author 一定返回空

  • 如果只要第三层 下的 ,写 /library/section/shelf/book/title//book/title 更快更准,尤其 XML 很大时
  • //book[2]/title 表示“文档中第二个 元素下的 ”,不是“每个 的第二个子元素”——XPath 的谓词作用于当前轴上的节点集,不是嵌套层级

含命名空间的 XML 必须注册前缀,否则 evaluate() 查不到任何节点

很多实际 XML(如 svgatom、SOAP)带命名空间,例如 。此时 //item 会返回空,因为默认命名空间没绑定到任何前缀。

  • 必须在调用 evaluate() 时传入命名空间解析函数,不能靠 setAttribute("xmlns", ...) 临时补
  • 解析函数形如 (prefix) => prefix === "rss" ? "http://purl.org/rss/1.0/" : NULL,返回对应 URI 或 null
  • XPath 表达式里得写 //rss:item,不能省略前缀——即使你只用了一个命名空间

常见错误:用 textContent 取值却忽略空白文本节点

XML 中换行缩进会产生 Text 节点,evaluate() 返回的 nodeIteratorSnapshot 里混着它们。直接取 textContent 会把前后空白、换行全拼进去,看着像数据异常。

立即学习前端免费学习笔记(深入)”;

  • 检查 node.nodeType === Node.ELEMENT_NODE 再取值,跳过 TEXT_NODE
  • 更稳妥的做法是用 node.querySelector("title")?.textContent.trim() 配合 DOM 方法兜底(前提是已解析为 XMLDocument
  • 若 XPath 返回多个节点,别假设 iterateNext() 一定有值——要循环判断 !== null,否则容易报 TypeError
const xmlStr = `   
<a href="https://seo.sqjnqi.com/tag/java/"><b>java</b></a>Script Guide John Doe
`; const parser = new DOMParser(); const xmlDoc = parser.parseFromString(xmlStr, "application/xml"); const result = xmlDoc.evaluate("//book[@id='1']/title/text()", xmlDoc, null, XPathResult.STRING_TYPE, null); console.log(result.stringValue); // "javascript Guide"

深层嵌套本身不难,难的是 XML 解析上下文、命名空间绑定、节点类型判断这三处——漏掉任意一个,evaluate() 都可能静默失败或返回意外结果。

text=ZqhQzanResources