scala原生支持xml字面量和解析,但自2.13起需手动引入scala-xml模块;通过XML.loadString/loadFile获取node,用、、@、text等操作提取数据并转为case class。

Scala 原生支持 XML 字面量和简单解析,靠的是标准库中的 scala-xml 模块(注意:从 Scala 2.13 开始,它已**移出默认依赖,需单独引入**)。解析 XML 在 Scala 中非常直观,尤其适合处理结构清晰、规模适中的 XML 数据。
添加 scala-xml 依赖
如果你用的是 sbt,在 build.sbt 中加上:
libraryDependencies += “org.scala-lang.modules” %% “scala-xml” % “2.2.0”
(版本号请根据你的 Scala 版本选择,例如 Scala 3.x 推荐用 2.2.0+;maven 或其他构建工具查对应坐标即可)
读取并解析 XML 字符串或文件
直接用 XML.loadString 或 XML.loadFile 得到一个 scala.xml.Node 对象:
val xml =
或者从字符串解析:
val doc = XML.loadString(“””
注意:XML 字面量只能在源码中写成纯标签形式(不能拼接变量),运行时解析推荐用 loadString / loadFile。
提取元素与属性(核心操作)
Node 支持类似 XPath 的链式访问,常用方法有:
- :查找直接子元素(深度 1),如
doc "book" - :递归查找所有匹配子元素(任意深度),如
doc "title" - @:获取属性值,如
(doc "book" @ "id")返回Attribute,通常转成字符串:(doc "book" @ "id").text - text:获取节点文本内容,如
(doc "title").text→"FP in Scala"
返回结果通常是 NodeSeq(可当 Seq 处理),支持 map、Filter、headOption 等操作。建议用 headOption 安全取值,避免空指针。
转换为 case class(实用技巧)
解析后常需转成业务对象。可以手动映射,比如:
case class Book(id: String, title: String, author: String)
val books = (doc “book”).map { node =>
Book(
(node @ “id”).text,
(node “title”).text,
(node “author”).text
)
}.toList
如果 XML 结构复杂或字段多,可封装成隐式转换或用第三方库(如 scalaxb)自动生成模型,但对多数场景,手写映射已足够清晰高效。
基本上就这些 —— 不复杂但容易忽略依赖声明和 NodeSeq 的集合语义。用熟了你会发现,比 java 的 dom 或 SAX 简洁太多。