Scala怎么解析XML Scala-xml库使用方法

1次阅读

scala原生支持xml字面量和解析,但自2.13起需手动引入scala-xml模块;通过XML.loadString/loadFile获取node,用、、@、text等操作提取数据并转为case class

Scala怎么解析XML Scala-xml库使用方法

Scala 原生支持 XML 字面量和简单解析,靠的是标准库中的 scala-xml 模块(注意:从 Scala 2.13 开始,它已**移出默认依赖,需单独引入**)。解析 XML 在 Scala 中非常直观,尤其适合处理结构清晰、规模适中的 XML 数据。

添加 scala-xml 依赖

如果你用的是 sbt,在 build.sbt 中加上:

libraryDependencies += “org.scala-lang.modules” %% “scala-xml” % “2.2.0”

(版本号请根据你的 Scala 版本选择,例如 Scala 3.x 推荐用 2.2.0+;maven 或其他构建工具查对应坐标即可)

读取并解析 XML 字符串或文件

直接用 XML.loadStringXML.loadFile 得到一个 scala.xml.Node 对象

val xml = Scala 编程 Martin

或者从字符串解析

val doc = XML.loadString(“””FP in Scala“””)

注意:XML 字面量只能在源码中写成纯标签形式(不能拼接变量),运行时解析推荐用 loadString / loadFile

Scala怎么解析XML Scala-xml库使用方法

Listnr

AI文本到语音生成器

Scala怎么解析XML Scala-xml库使用方法 180

查看详情 Scala怎么解析XML Scala-xml库使用方法

提取元素与属性(核心操作)

Node 支持类似 XPath 的链式访问,常用方法有:

  • :查找直接子元素(深度 1),如 doc "book"
  • 递归查找所有匹配子元素(任意深度),如 doc "title"
  • @:获取属性值,如 (doc "book" @ "id") 返回 Attribute,通常转成字符串:(doc "book" @ "id").text
  • text:获取节点文本内容,如 (doc "title").text"FP in Scala"

返回结果通常是 NodeSeq(可当 Seq 处理),支持 mapFilterheadOption 等操作。建议用 headOption 安全取值,避免空指针

转换为 case class(实用技巧)

解析后常需转成业务对象。可以手动映射,比如:

case class Book(id: String, title: String, author: String)

val books = (doc “book”).map { node =>
  Book(
    (node @ “id”).text,
    (node “title”).text,
    (node “author”).text
  )
}.toList

如果 XML 结构复杂或字段多,可封装隐式转换或用第三方库(如 scalaxb)自动生成模型,但对多数场景,手写映射已足够清晰高效。

基本上就这些 —— 不复杂但容易忽略依赖声明和 NodeSeq 的集合语义。用熟了你会发现,比 javadom 或 SAX 简洁太多。

text=ZqhQzanResources