网页元素定位

一、id 定位
标签的 id 具有唯一性，就像人的身份证。

二、name 定位
name 指定标签的名称，在页面中可以不唯一。

三、class 定位
class 指定标签的类名，在页面中可以不唯一。

四、tag 定位
每个 tag 往往用来定义一类功能，所以通过 tag 来识别某个元素的成功率很低，每个页面一般都用很多相同的 tag ，比如：<div>、<input> 等。

五、link 定位
link 专门用来定位文本链接。

六、partial_link 定位
partial_link 翻译过来就是“部分链接”，对于有些文本很长，这时候就可以只指定部分文本即可定位。

七、xpath 定位
xpath 是一种在 XML 文档中定位元素的语言，它拥有多种定位方式，下面通过实例我们看一下它的几种使用方式。

八、css 定位

CSS

使用选择器来为页面元素绑定属性，它可以较为灵活的选择控件的任意属性，一般定位速度比

xpath

要快，但使用起来略有难度。

具体操作见示例代码：

from selenium import webdriver                  #导入selenium库下的webdriver类。
from selenium.webdriver.common.by import By     #导入'定位方式'

p = r"F:\....\chromedriver.exe"        #版本 107.0.5304.88
dr = webdriver.Chrome(executable_path = p)      #1.打开浏览器
dr.get('http://www.txtbook.com.cn/')           #输入网址

aa = dr.find_element(By.ID,'bdshare_js')        #该写法，需要导入By类。
aa = dr.find_element(By.NAME,"keyword")         #name定位，在页面中可能不唯一。
aa = dr.find_element(By.CLASS_NAME,'categoryWrap01')        #class定位，在页面中可能不唯一。【样式】
aa = dr.find_element(By.TAG_NAME,'input')       #每一组<..>都是一个tag，每个 tag 往往用来定义一类功能，如：输入框、按钮、标签...等。
aa = dr.find_element(By.LINK_TEXT,'武印大陆TXT下载')         #link定位,用来[超链接文本]的定位，一定要[完整的文本]。
aa = dr.find_element(By.PARTIAL_LINK_TEXT,'武印')           #partial_link定位，功能和link定位一样，不过可以只要[部分文字]。如果页面中有多个，默认选第一个。

以上六种都相对比较简单。

#-----------利用XML进行XPATH定位元素

所有<>的标签用/隔开，有多个可以带上下标，如:/div[3]

<>标签内的可以同样用下标进行判断，如：/a[class="text"]；/a[price>30];

如果是相对路径，可以通过@加上元素名称进行组合，@起的内容表示条件，*号是通配符<>一个标签。

如：//*[@id="mainBody"]；//body[@id="mainBody"]

总的格式 <>标签用：/html; 标签内的属性用：[];如：/html/body/li[1]

# 绝对路径： /html/body/div[3]/div[5]/div[1]/div[2]/ul/li[1]/a
# 相对路径:  //*[@id="mainBody"]/div[5]/div[1]/div[2]/ul/li[1]/a
aa = dr.find_element(By.XPATH,'/html/body/div[3]/div[5]/div[1]/div[2]/ul/li[1]/a')
aa = dr.find_element(By.XPATH,'//*[@id="mainBody"]/div[5]/div[1]/div[2]/ul/li[1]/a')

#元素路径的获取还可以通过：浏览器，F12开发者模式，元素选择工具，点击页面元素，然后再F12中的代码位置。右击，复制，复制Xpath。

示例：

<html>
  <head>...<head/>
  <body>
    <div id="csdn-toolbar">
      <div class="toolbar-inside">
        <div class="toolbar-container">
          <div class="toolbar-container-left">...</div>
          <div class="toolbar-container-middle">
            <div class="toolbar-search onlySearch">
              <div class="toolbar-search-container">
                <input id="toolbar-search-input" autocomplete="off" type="text" value="" placeholder="C++难在哪里？">

根据上面的标签需要定位最后一行

input

标签，以下列出了四种方式，

xpath

定位的方式多样并不唯一，使用时根据情况进行解析即可。

# 绝对路径（层级关系）定位
driver.find_element_by_xpath(
    "/html/body/div/div/div/div[2]/div/div/input[1]")
# 利用元素属性定位
driver.find_element_by_xpath(
    "//*[@id='toolbar-search-input']"))
# 层级+元素属性定位
driver.find_element_by_xpath(
    "//div[@id='csdn-toolbar']/div/div/div[2]/div/div/input[1]")
# 逻辑运算符定位
driver.find_element_by_xpath(
    "//*[@id='toolbar-search-input' and @autocomplete='off']")

#-----------利用CSS层级定位，相对xpath要简洁，但符号多，相对复杂一点。

#代表id; .代表class; >子元素层级

aa = dr.find_element(By.CSS_SELECTOR,'#bdshare_js')

aa = dr.find_element(By.CSS_SELECTOR,'.categoryWrap01')

常见语法示例：

同样定位上面实例中的

input

标签。

driver.find_element_by_css_selector('#toolbar-search-input')
driver.find_element_by_css_selector('html>body>div>div>div>div>div>div>input')

标签：前端 selenium 自动化

本文转载自: https://blog.csdn.net/m0_62184088/article/details/127594215
版权归原作者 EUDI 所有，如有侵权，请联系我们删除。

【selenium模块-WEB自动化】八大网页元素定位方法（三）

网页元素定位

所有<>的标签用/隔开，有多个可以带上下标，如:/div[3]

<>标签内的可以同样用下标进行判断，如：/a[class="text"]；/a[price>30];

如果是相对路径，可以通过@加上元素名称进行组合，@起的内容表示条件，*号是通配符<>一个标签。

如：//*[@id="mainBody"]；//body[@id="mainBody"]

总的格式 <>标签用：/html; 标签内的属性用：[];如：/html/body/li[1]

发表评论

“【selenium模块-WEB自动化】八大网页元素定位方法（三）”的评论:

关于作者

overfit同步小助手

相关阅读

文章导航