Ruby怎么解析XML Nokogiri库使用方法

2次阅读

Nokogiri 是 ruby 中最常用、最可靠的 xmlhtml 解析库,基于 libxml2,支持 XPath 与 css 选择器,性能好、兼容性强;需先执行 gem install nokogiri 并 require ‘nokogiri’,再通过字符串或文件加载解析。

Ruby怎么解析XML Nokogiri库使用方法

Nokogiri 是 Ruby 中最常用、最可靠的 XML(和 HTML)解析库,用法简洁但功能强大。它底层基于 libxml2,性能好、兼容性强,支持 XPath 和 CSS 选择器,适合处理各种结构化文档。

安装与基础引入

在终端中运行安装命令:

gem install nokogiri

在 Ruby 脚本中引入:

require ‘nokogiri’

从字符串或文件加载 XML

解析 XML 字符串:

xml_string =   Alice
XML
doc = Nokogiri::XML(xml_string)

从文件加载:

Ruby怎么解析XML Nokogiri库使用方法

简小派

简小派是一款AI原生求职工具,通过简历优化、岗位匹配、项目生成、模拟面试与智能投递,全链路提升求职成功率,帮助普通人更快拿到更好的 offer。

Ruby怎么解析XML Nokogiri库使用方法 123

查看详情 Ruby怎么解析XML Nokogiri库使用方法

doc = Nokogiri::XML(File.open(‘data.xml’))

注意:Nokogiri 默认会报告解析警告。如需静默(忽略格式警告),加选项:

doc = Nokogiri::XML(xml_string) { |config| config.strict.nonet }

用 XPath 或 CSS 选择元素

推荐优先使用 XPath,表达力强;CSS 语法更直观,适合简单场景。

  • 查所有 name 元素:doc.xpath('//name')doc.css('name')
  • id=1 的 user:doc.xpath('//user[@id="1"]')doc.css('user[id="1"]')
  • 获取第一个匹配节点的文本:doc.at_xpath('//name').text"Alice"
  • 获取属性值:doc.at_xpath('//user').attribute('id').value"1"

修改和生成 XML

Nokogiri 支持动态构建和修改文档:

  • 新增子节点:user = doc.at_xpath('//user'); user.add_child('<email>alice@example.com</email>')
  • 修改文本内容:doc.at_xpath('//name').content = 'Bob'
  • 保存为字符串:doc.to_xml(保留缩进加 to_xml(indent: 2)
  • 写入文件:File.write('output.xml', doc.to_xml)

基本上就这些。掌握加载、查询、取值、修改四步,就能覆盖绝大多数 XML 处理需求。Nokogiri 的 API 设计很自然,多试几次 XPath 就上手了。

text=ZqhQzanResources