第一节:selenium概述
selenium是一个自动化测试工具,主要用于控制浏览器去完成指定操作。
第二节:在PyCharm中使用selenium
step1:在PyCharm终端输入pip install selenium (可以带参数-i https://pypi.tuna.tsinghua.edu.cn/simple)
step2:安装谷歌浏览器的驱动,地址:CNPM Binaries Mirror,此处要注意下载对于浏览器版本的驱动!在关于chrome中可以查看浏览器版本号。然后把安装包解压可以得到一个可执行文件,将该可执行文件放入python解释器的所在目录便可。
第三节:使用selenium自动控制浏览器
selenium库的使用可以参考文章:Python Selenium库的使用_凯耐的博客-CSDN博客_python selenium
下面演示控制百度搜索“selenium”关键字。
from selenium.webdriver import Chrome
from selenium.webdriver.common.keys import Keys
import time
# 创建对象
web = Chrome()
web.get("https://www.baidu.com/")
# 找到某个元素. 点击它
web.find_element_by_xpath('//*[@id="kw"]').send_keys("selenium")
time.sleep(2) # 让浏览器缓一会儿
el = web.find_element_by_id("su")
el.click() # 点击事件
第四节:selenium在大数据的使用
当前网页加密机制比较强,目前在浏览器中所看到的效果,往往是多次请求和脚本控制最终生成的效果,而用selenium控制浏览器则可以规避这些过程,绕过这些复杂的机制从而获取网页中的数据。
版权归原作者 芯心智库 所有, 如有侵权,请联系我们删除。