0


selenium模拟鼠标滚动

selenium模拟鼠标滑动

在自动化或者爬虫中往往需要使用selenium模拟鼠标滑动功能,找了好久都没有找到合适的代码,于是干脆自己写一个

这是可以实现滑动的js代码,需要做的就是将以下代码加入selenium中

let intervalId;functionscrollPage(){
    window.scrollBy(0,10);//设置每次滚动10个像素}// 添加滚动事件监听器
window.addEventListener('scroll',functioncheckIfBottom(){// 检查是否到达可视区域底部(这里使用了一个常见的判断方法)if(window.innerHeight + window.scrollY >= document.body.scrollHeight){clearInterval(intervalId);
        window.removeEventListener('scroll', checkIfBottom);// 停止监听滚动事件}});

intervalId =setInterval(scrollPage,10);//每隔10毫秒执行一次滚动

以下代码可以适配大多数的网页

# 导入必要的模块  from selenium import webdriver  # 导入Selenium的webdriver模块,用于控制浏览器  import threading  # 导入线程模块,用于多线程处理  import time  # 导入时间模块,用于控制程序的执行时间  # 创建浏览器驱动实例(这里以Chrome为例)  
service = webdriver.EdgeService(executable_path='./msedgedriver.exe')# 创建Edge浏览器的服务实例  
driver = webdriver.Edge(service=service)# 使用上一步创建的服务实例来创建一个Edge浏览器驱动实例  # 访问某个网页  
driver.get('url')# 使用驱动实例打开指定的网页  defscroll_to_bottom():global driver  # 使用全局变量driver,确保该函数能访问到驱动实例  whileTrue:# 无限循环,直到满足退出条件  # 执行滚动操作  
        driver.execute_script("window.scrollBy(0,8);")# 滚动页面,每次向下滚动8px  # 检查是否到达页面底部(这里假设当滚动到底部时,body的高度不再变化)  
        body_height = driver.execute_script("return document.body.scrollHeight;")# 获取页面主体的总高度  
        current_scroll = driver.execute_script("return document.documentElement.scrollTop || document.body.scrollTop;")# 获取当前滚动条的位置  if current_scroll + driver.execute_script("return window.innerHeight;")>= body_height:# 当当前滚动条的位置加上视口的高度大于或等于页面的总高度时,满足退出条件  break# 跳出循环  # 尝试模拟10毫秒的间隔,但由于线程切换的时间开销,这个间隔并不能保证精准为10毫秒  
        time.sleep(0.001)# 1毫秒睡眠(实际可能会大于1毫秒)  # 1毫秒睡眠(实际可能会大于1毫秒)这一行重复了,应该删除一个  # 开始滚动任务  
scroll_thread = threading.Thread(target=scroll_to_bottom)# 创建一个新线程来执行滚动任务  
scroll_thread.start()# 启动新线程  # 确保主线程等待滚动任务完成  
scroll_thread.join()# 主线程会等待滚动任务完成后再继续执行下面的代码  print('滑动已完成')# 打印“滑动已完成”到控制台,表示滚动任务已完成  
time.sleep(20)# 使程序暂停20秒,这里主要用于模拟人工查看网页的过程,你可以根据实际需求调整时间  # 清理资源  
driver.quit()# 关闭浏览器驱动实例,释放资源

对上面的代码优化了一下

# 导入所需的模块  from selenium import webdriver  # 导入Selenium的webdriver模块,用于控制浏览器  from selenium.webdriver.support import expected_conditions as EC  # 导入预期条件,用于等待某个条件成立后再执行下一步操作  import time  # 导入时间模块,用于控制程序的执行时间  # 创建浏览器驱动实例(以Chrome为例)  
service = webdriver.EdgeService(executable_path='./msedgedriver.exe')# 创建Edge浏览器的服务实例  
driver = webdriver.Edge(service=service)# 使用上一步创建的服务实例来创建一个Edge浏览器驱动实例  # 访问某个网页  
driver.get('url')# 使用驱动实例打开指定的网页  # 定义滚动到页面底部的函数  defscroll_to_bottom(driver):# 定义一个名为scroll_to_bottom的函数,参数为driver  # 执行滚动操作,并使用EC.implicitly_wait来等待滚动完成  
    body_height = driver.execute_script("return document.body.scrollHeight;")# 执行JavaScript代码,获取页面主体的总高度  
    current_scroll = driver.execute_script("return document.documentElement.scrollTop || document.body.scrollTop;")# 获取当前滚动条的位置  while current_scroll + driver.execute_script("return window.innerHeight;")< body_height:# 当当前滚动条的位置加上视口的高度小于页面的总高度时,继续循环  
        driver.execute_script("window.scrollBy(0,8);")# 滚动页面,每次向下滚动8px  
        current_scroll = driver.execute_script("return document.documentElement.scrollTop || document.body.scrollTop;")# 获取滚动后的滚动条位置  
        driver.implicitly_wait(1)# 设置隐式等待时间为1秒,以便在滚动过程中检查元素是否出现  
    driver.implicitly_wait(0)# 当滚动到达底部时,取消隐式等待,不再等待元素出现  # 开始滚动任务  
scroll_to_bottom(driver)# 调用scroll_to_bottom函数,传入驱动实例作为参数,开始滚动任务  print('滚动已完成')# 打印“滚动已完成”到控制台,表示滚动任务已完成  # 等待8秒  
time.sleep(20)# 使程序暂停8秒,这里主要用于模拟人工查看网页的过程,你可以根据实际需求调整时间  # 清理资源  
driver.quit()# 关闭浏览器驱动实例,释放资源
标签: python selenium 爬虫

本文转载自: https://blog.csdn.net/LEITANAN/article/details/135467387
版权归原作者 Ru_qian 所有, 如有侵权,请联系我们删除。

“selenium模拟鼠标滚动”的评论:

还没有评论