怎么用XPath选取文本节点 text()的用法

14次阅读

text() 选取元素的直接文本子节点而非所有后代或元素本身；例如 //div/text() 匹配 “Hello” 和 “!”，但不匹配嵌套在中的 “World”。

XPath 中的 text() 是用来选取元素的直接文本子节点，不是所有后代文本，也不是元素本身，而是紧贴在该元素标签内的纯文字内容。

text() 只匹配直接子文本节点

比如 html 片段：

HelloWorld!

其中 //div/text() 会匹配到两个文本节点：“Hello” 和 “!”，但不会匹配里的 “World”，因为它不是

 的直接子文本节点，而是嵌套在  内的。 
常见用法和注意事项
要获取某个元素的全部可见文本（含后代），用 String(//div) 或 //div//text()（后者返回所有后代文本节点，需合并）
 text() 返回的是节点集，不是字符串；在支持 XPath 1.0 的环境（如浏览器控制台、Selenium）中，不能直接用 text() 做等于判断，得用 normalize-space() 处理空白
匹配精确文本时建议写成：//div[normalize-space(text()) = "Hello"]，避免前后空格或换行干扰
如果一个元素内有多个 text() 节点（比如被注释或标签隔开），text()[1] 可取第一个，text()[last()] 取最后一个
实际例子：抓取标题但避开图标文字
假设有：
  用户中心 v2.1 

 想只取“用户中心”这个文本，可以：
//h2/text()[normalize-space() != ""] → 得到中间那个非空文本节点
 或者更稳一点：//h2/text()[contains(., "用户中心")]
不推荐的写法
//div/text() = "Hello" 在多数 XPath 引擎中会报错或行为异常，因为 = 左侧是节点集，右侧是字符串，类型不匹配。
 应改用：//div[text() = "Hello"]（前提是整个元素只有这一个 text 子节点），或更稳妥的：//div[normalize-space() = "Hello"]
基本上就这些。text() 看似简单，但容易忽略它只管“直接子”、不处理空白、不自动合并这些细节。

    发表于：后端开发 
  2026-01-19 
 
   # ai# class# html# String# 字符串# 浏览器
 
  复制链接

      c++中如何进行网络编程socket通信_c++ socket编程简单实例
 
    Go install 命令不生成可执行文件的常见原因与正确项目结构指南
 
    C#怎么进行文件读写 C#使用StreamReader和StreamWriter操作文本文件
 
    Golang如何升级第三方模块
 
  
 
    sublime如何自定义代码片段_sublime设置Snippet快捷补全【详解】
上一篇 
  Blazor 怎么处理按钮点击事件
下一篇

     文章搜索 
     
 
 
 
   随机文章 
     C# UDP通信方法 C#如何实现UDP Socket编程 
 
   omposer怎么在VS Code中调试代码_composer路径配置与编辑器插件使用【技巧】 
 
   如何使用 PHP 基于上传的 PDF 模板动态生成新 PDF 文档 
 
   如何用 HTML + JavaScript 构建可验证答案的在线测验系统 
 
   什么是盈亏比？做合约胜率重要还是盈亏比重要？ 
 
   最新文章 
     如何使用嵌套 for 循环对字符串列表及其每个字符进行逐层遍历与输出 
 
   系统时间被恶意修改后如何通过 audit.log 追踪修改命令 
 
   如何使用 Flexbox 将图标水平居中并垂直居中于左侧矩形容器内 
 
   如何在多进程环境中正确共享和更新嵌套对象的数据 
 
   如何用 NULLS LAST / NULLS FIRST 控制 NULL 在排序中的位置 
 
   标签云 
  .net@keyframes123041230620252025年3a游戏3d软件500错误7-zipaccessAccessorsacfunactionscriptactivemqadbadobeadobe acrobat readeragiaiAIGCairpodsai大模型ai工具ai编程ai芯片ai视频ajaxalertalgo币

      分享至
  
   
 
  
 
 
 
 
 
 
 
    
  
  
 
 
 
 
   
 
   Copyright ©  SEO  Theme by Puock