XPath中ancestor轴选取所有上级祖先节点(不含自身),descendant轴选取所有下级后代节点(不含自身);二者均为路径方向关键词而非函数,配合谓词可精准定位,且存在包含自身的ancestor-or-self和descendant-or-self变体。

XPath 中选取祖先节点和后代节点,主要靠 ancestor 和 descendant 这两个轴(axis),它们不是函数,而是用于定位相对关系的路径方向关键词。
ancestor 轴:选所有上级祖先节点
ancestor 轴从当前节点出发,向上匹配所有父级、祖父级……直到根节点的元素(不包括自身)。
- 写法是:
//div[@id="content"]/ancestor::section—— 找 id 为 content 的 div 的所有 section 类型祖先 - 常用变体:
ancestor::*匹配所有祖先元素(任意标签);ancestor::body只匹配 body 祖先 - 注意:
ancestor不包含当前节点,也不包含父节点(parent)以外的“直接”限制——它就是全部向上穿透
descendant 轴:选所有下级后代节点
descendant 轴从当前节点出发,向下匹配所有子孙节点(子、孙、曾孙……任意深度,不包括自身)。
- 写法是:
//ul/descendant::li—— 找 ul 下所有层级的 li 元素(比//ul//li更明确表达“后代”语义) - 常用写法:
descendant::*匹配所有后代元素;descendant::span只找 span 后代 - 对比
//:虽然//ul//li效果常等价于//ul/descendant::li,但后者语义更清晰,也支持更精确的限定(比如加位置或条件)
ancestor-or-self 和 descendant-or-self
如果想包含当前节点本身,就用带 -or-self 的版本:
-
ancestor-or-self::div→ 当前节点如果是 div,也会被选中;否则只选 div 类型的祖先 -
descendant-or-self::p→ 当前节点如果是 p,加上它所有的 p 后代 - 简写提示:
//p实际等价于/descendant-or-self::*/p(在文档根开始查)
实际用时的小提醒
这些轴通常配合谓词(方括号)使用,才能真正精准定位:
- 找某个 div 的最近一个 class=”wrapper” 的祖先:
//div[@id="main"]/ancestor::*[@class="wrapper"][1] - 找 table 下第二层的所有 td(排除嵌套 table 里的 td):
//table/descendant::tr[2]/td或更稳一点://table/tr/td(用层级比 descendant 更可控) - ancestor/descendant 轴性能略低,深层嵌套时不如用明确层级(如
../..或div/div/p)高效,优先考虑可读性和稳定性
基本上就这些。记住 axis 是“方向”,不是函数,后面跟双冒号再写节点名,搭配谓词就能灵活控制范围。