XSLT怎么从一个字符串中解析出XML(parse-xml)

1次阅读

XSLT 3.0 提供 parse-xml() 函数将良构 XML 字符串转为文档节点,要求字符串格式良好、不支持 DTD/外部实体,需配合 try/catch 处理异常,XSLT 2.0 不支持。

XSLT怎么从一个字符串中解析出XML(parse-xml)

XSLT 本身不能直接“解析”任意字符串为 XML(比如像 javaScript 的 DOMParser 那样),但自 XSLT 3.0 起,标准提供了 parse-xml() 函数,专门用于将**格式良好的 XML 字符串**安全地转换为可操作的树结构(即一个文档节点)。

parse-xml() 的基本用法

该函数接收一个字符串参数,返回一个文档节点(document-node())。前提是字符串内容必须是良构(well-formed)的 XML,否则会抛出运行时错误(如 XPDY0002)。

示例:

<xsl:variable name="xml-str" select="'<root><item id="1">A</item><item id="2">B</item></root>'"/> <xsl:variable name="doc" select="parse-xml($xml-str)"/> <!-- 现在可以像处理普通 XML 一样遍历 --> <xsl:for-each select="$doc/root/item">   <output id="{@id}"><xsl:value-of select="."/></output> </xsl:for-each>

常见注意事项和限制

parse-xml() 是纯函数,不支持 DTD、外部实体、命名空间前缀绑定(除非字符串中已声明)、XML 声明中的编码声明(实际只按 UTF-8 或 UTF-16 处理)等高级特性。它只做语法解析,不进行验证。

  • 字符串中不能含未转义的 、<code>&,必须是合法 XML 文本(例如 < 表示字面小于号)
  • 不能解析 html;若需处理 HTML,应使用 parse-html()(XSLT 3.0+,需处理器支持)
  • 若字符串来自不可信来源,建议先用 try/catch 包裹,避免崩溃

配合 try/catch 安全使用(XSLT 3.0)

当输入可能非法时,用 xsl:try 捕获解析失败:

XSLT怎么从一个字符串中解析出XML(parse-xml)

美图AI开放平台

美图推出的AI人脸图像处理平台

XSLT怎么从一个字符串中解析出XML(parse-xml) 111

查看详情 XSLT怎么从一个字符串中解析出XML(parse-xml)

<xsl:try>   <xsl:variable name="parsed" select="parse-xml($input)"/>   <xsl:sequence select="$parsed//item"/>   <xsl:catch>     <error>Invalid XML: <xsl:value-of select="$input"/></error>   </xsl:catch> </xsl:try>

兼容性提醒:XSLT 2.0 不支持 parse-xml()

如果你用的是 XSLT 2.0 处理器(如 older Saxon-B、Xalan),parse-xml() 不可用。此时只能依赖处理器扩展函数(如 Saxon 9.1+ 的 saxon:parse()),或把解析逻辑前置到宿主语言(Java/python)中完成。

确认版本:检查你使用的处理器是否支持 XSLT 3.0(推荐 Saxon-HE 10+、Saxon-PE/EE 9.8+ 或 newer)。

基本上就这些。核心是:字符串要合法、用对版本、加好异常处理——parse-xml 就很可靠。

text=ZqhQzanResources