xpath - 定位元素
1、xpath:
使用路径表达式来定位xml或者html中文档中选取节点。
在Xpath中,有七种类型的节点:元素、属性、文本、命名空间、处理指令、注释以及文档节点(或称为根节点 )
2、基础语法:
1)、路劲表达式
【nodename】:选取此节点的所有子节点。
【/】:从根节点选取。(可以理解为后面跟的是绝对路径)
【//】:从匹配选择的当前节点选择文档中的节点,而不考虑它们的位置。(相对路径)
【.】:选取当前节点。
【…】:选取当前节点的父节点。
【@】:选取属性。后面跟属性名
2)、谓语:
放在方括号[]中,相当于筛选条件,用来查找[]中指定的特定节点或者包含某个指定的值的节点。在下面的表格中,列出了带有谓语的一些路径表达式,以及表达式的结果:
路劲表达式结果/bookstore/book[1]选取属于 bookstore 子元素的第一个 book 元素。/bookstore/book[last()]选取属于 bookstore 子元素的最后一个 book 元素。/bookstore/book[last()-1]选取属于 bookstore 子元素的倒数第二个 book 元素。/bookstore/book[position()❤️]选取最前面的两个属于 bookstore 元素的子元素的 book 元素。//title[@lang]@lang表示lang属性,//title表示选取所有title元素,这个表达式表示的是选取所有带 lang 属性的 title 元素。//title[@lang=‘eng’]选取所有 title 元素,且元素的lang属性值为eng/bookstore/book[price>35.00]选取 bookstore 元素的所有 book 元素,且其中的 price 元素的值须大于 35.00。/bookstore/book[price>35.00]/title·选取 bookstore 元素中的 book 元素的所有 title 元素,且其中的 price 元素的值须大于 35.00––
XPath通配符可用来选取未知的XML元素
通配符描述*匹配任何元素节点@*匹配任何属性节点node()匹配任何类型的节点
下列表格中为路径表达式,以及这些表达式的结果
|
路劲表达式结果/bookstore/*选取 bookstore 元素的所有子元素。//选取文档中的所有元素。//title[@]选取所有带有属性的 title 元素。
3、Xpath运算符
【路劲表达式】【结果 】
【//book/title | //book/price】:选取 book 元素的所有 title 和 price 元素。
【//title | //price】:选取文档中的所有 title 和 price 元素。
【/bookstore/book/title | //price】:选取属于 bookstore 元素的 book 元素的所有 title 元素,以及文档中所有的 price 元素。
4、xpath常用函数
实例返回值last()返回当前上下文中的最后一个节点的位置号码数position()返回当前节点的位置的数字,位于第多少个text()获取节点中的文本
常用方法
1、contains
包含,eg://div[contains@class,‘xx’]
查找div元素,元素的class属性值包含xx
2、starts-with
以某某开头,eg://input[starts-with(@class,‘xx’)]
查找input元素,元素的class属性值以xx开头
3、ends-with
以某某结尾,eg://input[ends-with(@class,‘xx’)]
查找input元素,元素的class属性值以xx结尾
4、not
否定的意思,eg:input[not(id=‘123’)]
查找id值不是123的input元素。
//span[not(contains(text(),‘123’))]
查找一个文本内容不包含123的span标签。
5、*通配符
表示通配符,eg://span[@=‘123’]
span标签的任何属性为123的元素
参考文献1
参考文献2
版权归原作者 weixin_41959733 所有, 如有侵权,请联系我们删除。