selenium模拟鼠标滑动
在自动化或者爬虫中往往需要使用selenium模拟鼠标滑动功能,找了好久都没有找到合适的代码,于是干脆自己写一个
这是可以实现滑动的js代码,需要做的就是将以下代码加入selenium中
let intervalId;functionscrollPage(){
window.scrollBy(0,10);//设置每次滚动10个像素}// 添加滚动事件监听器
window.addEventListener('scroll',functioncheckIfBottom(){// 检查是否到达可视区域底部(这里使用了一个常见的判断方法)if(window.innerHeight + window.scrollY >= document.body.scrollHeight){clearInterval(intervalId);
window.removeEventListener('scroll', checkIfBottom);// 停止监听滚动事件}});
intervalId =setInterval(scrollPage,10);//每隔10毫秒执行一次滚动
以下代码可以适配大多数的网页
# 导入必要的模块 from selenium import webdriver # 导入Selenium的webdriver模块,用于控制浏览器 import threading # 导入线程模块,用于多线程处理 import time # 导入时间模块,用于控制程序的执行时间 # 创建浏览器驱动实例(这里以Chrome为例)
service = webdriver.EdgeService(executable_path='./msedgedriver.exe')# 创建Edge浏览器的服务实例
driver = webdriver.Edge(service=service)# 使用上一步创建的服务实例来创建一个Edge浏览器驱动实例 # 访问某个网页
driver.get('url')# 使用驱动实例打开指定的网页 defscroll_to_bottom():global driver # 使用全局变量driver,确保该函数能访问到驱动实例 whileTrue:# 无限循环,直到满足退出条件 # 执行滚动操作
driver.execute_script("window.scrollBy(0,8);")# 滚动页面,每次向下滚动8px # 检查是否到达页面底部(这里假设当滚动到底部时,body的高度不再变化)
body_height = driver.execute_script("return document.body.scrollHeight;")# 获取页面主体的总高度
current_scroll = driver.execute_script("return document.documentElement.scrollTop || document.body.scrollTop;")# 获取当前滚动条的位置 if current_scroll + driver.execute_script("return window.innerHeight;")>= body_height:# 当当前滚动条的位置加上视口的高度大于或等于页面的总高度时,满足退出条件 break# 跳出循环 # 尝试模拟10毫秒的间隔,但由于线程切换的时间开销,这个间隔并不能保证精准为10毫秒
time.sleep(0.001)# 1毫秒睡眠(实际可能会大于1毫秒) # 1毫秒睡眠(实际可能会大于1毫秒)这一行重复了,应该删除一个 # 开始滚动任务
scroll_thread = threading.Thread(target=scroll_to_bottom)# 创建一个新线程来执行滚动任务
scroll_thread.start()# 启动新线程 # 确保主线程等待滚动任务完成
scroll_thread.join()# 主线程会等待滚动任务完成后再继续执行下面的代码 print('滑动已完成')# 打印“滑动已完成”到控制台,表示滚动任务已完成
time.sleep(20)# 使程序暂停20秒,这里主要用于模拟人工查看网页的过程,你可以根据实际需求调整时间 # 清理资源
driver.quit()# 关闭浏览器驱动实例,释放资源
对上面的代码优化了一下
# 导入所需的模块 from selenium import webdriver # 导入Selenium的webdriver模块,用于控制浏览器 from selenium.webdriver.support import expected_conditions as EC # 导入预期条件,用于等待某个条件成立后再执行下一步操作 import time # 导入时间模块,用于控制程序的执行时间 # 创建浏览器驱动实例(以Chrome为例)
service = webdriver.EdgeService(executable_path='./msedgedriver.exe')# 创建Edge浏览器的服务实例
driver = webdriver.Edge(service=service)# 使用上一步创建的服务实例来创建一个Edge浏览器驱动实例 # 访问某个网页
driver.get('url')# 使用驱动实例打开指定的网页 # 定义滚动到页面底部的函数 defscroll_to_bottom(driver):# 定义一个名为scroll_to_bottom的函数,参数为driver # 执行滚动操作,并使用EC.implicitly_wait来等待滚动完成
body_height = driver.execute_script("return document.body.scrollHeight;")# 执行JavaScript代码,获取页面主体的总高度
current_scroll = driver.execute_script("return document.documentElement.scrollTop || document.body.scrollTop;")# 获取当前滚动条的位置 while current_scroll + driver.execute_script("return window.innerHeight;")< body_height:# 当当前滚动条的位置加上视口的高度小于页面的总高度时,继续循环
driver.execute_script("window.scrollBy(0,8);")# 滚动页面,每次向下滚动8px
current_scroll = driver.execute_script("return document.documentElement.scrollTop || document.body.scrollTop;")# 获取滚动后的滚动条位置
driver.implicitly_wait(1)# 设置隐式等待时间为1秒,以便在滚动过程中检查元素是否出现
driver.implicitly_wait(0)# 当滚动到达底部时,取消隐式等待,不再等待元素出现 # 开始滚动任务
scroll_to_bottom(driver)# 调用scroll_to_bottom函数,传入驱动实例作为参数,开始滚动任务 print('滚动已完成')# 打印“滚动已完成”到控制台,表示滚动任务已完成 # 等待8秒
time.sleep(20)# 使程序暂停8秒,这里主要用于模拟人工查看网页的过程,你可以根据实际需求调整时间 # 清理资源
driver.quit()# 关闭浏览器驱动实例,释放资源
本文转载自: https://blog.csdn.net/LEITANAN/article/details/135467387
版权归原作者 Ru_qian 所有, 如有侵权,请联系我们删除。
版权归原作者 Ru_qian 所有, 如有侵权,请联系我们删除。