Nokogiri 是 ruby 中最常用、最可靠的 xml 和 html 解析库,基于 libxml2,支持 XPath 与 css 选择器,性能好、兼容性强;需先执行 gem install nokogiri 并 require ‘nokogiri’,再通过字符串或文件加载解析。

Nokogiri 是 Ruby 中最常用、最可靠的 XML(和 HTML)解析库,用法简洁但功能强大。它底层基于 libxml2,性能好、兼容性强,支持 XPath 和 CSS 选择器,适合处理各种结构化文档。
安装与基础引入
在终端中运行安装命令:
gem install nokogiri
在 Ruby 脚本中引入:
require ‘nokogiri’
从字符串或文件加载 XML
解析 XML 字符串:
xml_string =
XML
doc = Nokogiri::XML(xml_string)
从文件加载:
doc = Nokogiri::XML(File.open(‘data.xml’))
注意:Nokogiri 默认会报告解析警告。如需静默(忽略格式警告),加选项:
doc = Nokogiri::XML(xml_string) { |config| config.strict.nonet }
用 XPath 或 CSS 选择元素
推荐优先使用 XPath,表达力强;CSS 语法更直观,适合简单场景。
- 查所有 name 元素:
doc.xpath('//name')或doc.css('name') - 查 id=1 的 user:
doc.xpath('//user[@id="1"]')或doc.css('user[id="1"]') - 获取第一个匹配节点的文本:
doc.at_xpath('//name').text→"Alice" - 获取属性值:
doc.at_xpath('//user').attribute('id').value→"1"
修改和生成 XML
Nokogiri 支持动态构建和修改文档:
- 新增子节点:
user = doc.at_xpath('//user'); user.add_child('<email>alice@example.com</email>') - 修改文本内容:
doc.at_xpath('//name').content = 'Bob' - 保存为字符串:
doc.to_xml(保留缩进加to_xml(indent: 2)) - 写入文件:
File.write('output.xml', doc.to_xml)
基本上就这些。掌握加载、查询、取值、修改四步,就能覆盖绝大多数 XML 处理需求。Nokogiri 的 API 设计很自然,多试几次 XPath 就上手了。