去掉自动化标识,绕过js,绕过ip
import time
from selenium import webdriver
from selenium.webdriver.chrome.options import Options
# 去掉自动化标识,绕过js
option = Options()
option.add_experimental_option('excludeSwitches',['enable-automation'])
option.add_argument('--disable-blink-features=AutomationControlled')# 确定用户文件 ,绕过ip (要把其他已经打开的浏览器关掉)
option.add_argument(r'--user-data-dir=C:\Users\PC\AppData\Local\Google\Chrome\User Data')
time.sleep(2)
driver = webdriver.Chrome(options = option)
图形验证码获取
import ddddocr
from selenium import webdriver
# 定位到图片元素,获取验证码图片链接
imgelement = driver.find_element('xpath','/html/body/div[1]/div/div[2]/div/div[2]/div/div/div[3]/div[2]/div/div/img')# 定位验证码图片
imgelement.screenshot('captcha.jpg')#保存验证码截图# 验证码识别
ocr = ddddocr.DdddOcr()withopen('captcha.jpg','rb')as f:
img_bytes = f.read()
res = ocr.classification(img_bytes)print('识别出的验证码为:'+ res)# 填写验证码
driver.find_element_by_id(yanzhengmaid).send_keys(res)
获取用户名的 动态id,并通过id定位元素
#selenium定位时,发现网页的用户名和密码的id是动态变化的,但有一定的规律
nameId=driver.find_element_by_xpath("//input[starts-with(@id,169)]").get_attribute("id")#此处是一个以169开头的动态id
driver.find_element_by_id(nameId).send_keys('yonghuming')#定位id,并输入值
passwordId=driver.find_element_by_xpath("//input[ends-with(@id,'ps-k')]").get_attribute("id")#此处是一个以ps-k结尾的动态id
driver.find_element_by_id(passwordId).send_keys('mima')
testId=driver.find_element_by_xpath("//input[contains(@id,'test')]").get_attribute("id")#此处是一个包含test的动态id
driver.find_element_by_id(testId).click()
本文转载自: https://blog.csdn.net/hy_13629279398/article/details/132618409
版权归原作者 韩同学叫园园 所有, 如有侵权,请联系我们删除。
版权归原作者 韩同学叫园园 所有, 如有侵权,请联系我们删除。