0


Selenium安装以及案例演示【Java爬虫】

一、Selenium简介

Selenium是一个用于Web应用程序自动化测试工具。Selenium测试直接运行在浏览器中,就像真正的用户在操作一样。支持的浏览器包括IE(7, 8, 9, 10, 11),Mozilla Firefox,Safari,Google Chrome,Opera等。适用于自动化测试,js动态爬虫(破解反爬虫)等领域。

安装的详细过程可以参考这篇文章!!!

Selenium 的安装和基本使用_小小明-代码实体的博客-CSDN博客

二、Selenium组成

1)Selenium IDE:嵌入到Firefox浏览器中的一个插件,实现简单的浏览器操作录制与回放功能,主要用于快速创建BUG及重现脚本,可转化为多种语言

2)Selenium RC: 核心组件,支持多种不同语言编写自动化测试脚本,通过其服务器作为代理服务器去访问应用,达到测试的目的

3)Selenium WebDriver(重点):一个浏览器自动化框架,它接受命令并将它们发送到浏览器。它是通过特定于浏览器的驱动程序实现的。它直接与浏览器通信并对其进行控制。Selenium WebDriver支持各种编程语言,如Java、C# 、PHP、Python、Perl、Ruby

4)Selenium grid:测试辅助工具,用于做分布式测试,可以并行执行多个测试任务,提升测试效率。

三、Selenium特点

  1. 1)开源、免费
  2. 2)多浏览器支持:FireFoxChromeIEOperaEdge;
  3. 3)多平台支持:LinuxWindowsMAC;
  4. 4)多语言支持:JavaPythonRubyC#、JavaScript、C++;
  5. 5)对Web页面有良好的支持;
  6. 6)简单(API 简单)、灵活(用开发语言驱动);
  7. 7)支持分布式测试用例执行。

四、案例演示

爬虫:数据采集、数据清晰、数据分析!!!

4.1 java爬虫入门

下载驱动包
http://chromedriver.storage.googleapis.com/index.html

创建项目并导入依赖

  1. <dependency>
  2. <groupId>org.seleniumhq.selenium</groupId>
  3. <artifactId>selenium-java</artifactId>
  4. <version>3.141.59</version>
  5. </dependency>

入门

  1. //设置驱动
  2. System.setProperty("webdriver.chrome.driver","D:\\chromedriver.exe");
  3. //创建驱动
  4. WebDriver driver=new ChromeDriver();
  5. //与将要爬取的网站建立连接
  6. driver.get("https://www.baidu.com");
  7. //关闭浏览器
  8. driver.close();
  9. //释放资源
  10. driver.quit();

4.2 相关API

** 1.元素选择方式**

  1. 1Class选择:driver.findElement(By.className("s_ipt"));
  2. 2ID选择: driver.findElement(By.id("kw"));
  3. 3name选择: driver.findElement(By.name("wd"));
  4. 4tag选择: driver.findElements(By.tagName("input"));
  5. 5link选择: driver.findElement(By.linkText("地图"));
  6. 6Partial link选择(a标签文本内容模糊匹配):driver.findElement(By.partialLinkText("使用百"));
  7. 7css选择器:driver.findElement(By.cssSelector("#kw"));
  8. 8xpath选择:driver.findElement(By.xpath("//*[@id=\"kw\"]"));

** 2.获取单个元素:driver.findElement**

** 3.获取多个元素:driver.findElements**

** 4.输入内容:input.sendKeys("java");**

** 5.元素点击:element.click();**

** 6.获取元素属性:nextPageEle.getAttribute("class")**

** 7.获取标签文本内容:titleEle.getText()**

  1. package com.zking;
  2. import org.openqa.selenium.By;
  3. import org.openqa.selenium.WebDriver;
  4. import org.openqa.selenium.chrome.ChromeDriver;
  5. import java.util.List;
  6. public class Demo {
  7. public static void main(String[] args) {
  8. //设置驱动
  9. System.setProperty("webdriver.chrome.driver", "D:\\app\\Administrator\\initPath\\chromedriver.exe");
  10. //创建驱动
  11. WebDriver driver = new ChromeDriver();
  12. //与将要爬取的网站建立连接
  13. driver.get("https://www.baidu.com");
  14. // 1)Class选择:driver.findElement(By.className("s_ipt"));
  15. // WebElement element=driver.findElement(By.className("s_btn"));
  16. // System.out.println(element.getAttribute("value"));
  17. //
  18. // 2)ID选择: driver.findElement(By.id("kw"));
  19. // WebElement element=driver.findElement(By.id("kw"));
  20. // System.out.println(element.getAttribute("class"));
  21. //
  22. // 3)name选择: driver.findElement(By.name("wd"));
  23. // WebElement element=driver.findElement(By.name("wd"));
  24. // System.out.println(element.getAttribute("maxlength"));
  25. //
  26. // 4)tag选择: driver.findElements(By.tagName("input"));
  27. // List<WebElement> elements = driver.findElements(By.tagName("a"));
  28. // for (WebElement element:elements){
  29. // System.out.println(element.getText().trim());
  30. // }
  31. // 5)link选择: driver.findElement(By.linkText("地图"));
  32. // WebElement elemen = driver.findElement(By.linkText("网盘"));
  33. // System.out.println(elemen.getText());
  34. // 6)Partial link选择(a标签文本内容模糊匹配):driver.findElement(By.partialLinkText("使用百"));
  35. // List<WebElement> elements = driver.findElements(By.partialLinkText("人"));
  36. // for (WebElement element:elements){
  37. // System.out.println(element.getText());
  38. // }
  39. // 7)css选择器:driver.findElement(By.cssSelector("#kw"));
  40. // List<WebElement> elements = driver.findElements(By.cssSelector("#hotsearch-content-wrapper > li:nth-child(1)"));
  41. // for(WebElement element:elements){
  42. // System.out.println(element.getText());
  43. // }
  44. // 8)xpath选择:driver.findElement(By.xpath("//*[@id=\"kw\"]"));
  45. // WebElement element = driver.findElement(By.xpath("//*[@id=\"kw\"]"));
  46. // System.out.println(element.getAttribute("value"));
  47. //
  48. // driver.findElement(By.id("kw")).sendKeys("java");
  49. // driver.findElement(By.id("su")).click();
  50. // }
  51. }
  52. }

以上就是今天的分享!!!

我的博客即将同步至腾讯云开发者社区,邀请大家一同入驻:https://cloud.tencent.com/developer/support-plan?invite_code=1y1pcwsaf33mn


本文转载自: https://blog.csdn.net/m0_62246061/article/details/127861228
版权归原作者 天蝎座的程序媛 所有, 如有侵权,请联系我们删除。

“Selenium安装以及案例演示【Java爬虫】”的评论:

还没有评论