0


从零开始使用Springboot,selenium进行爬虫

环境

  • 系统:ubuntu 22.04.1
  • java:11
  • Chrome浏览器:126.0.6478.126
  • Chrome浏览器驱动:126.0.6478.126
  • idea:2024社区版

下载Chrome和对应chromedriver

点击下面网址下载:
https://googlechromelabs.github.io/chrome-for-testing/#stable
下载对应平台和版本的Chrome和Chromedriver,复制网址下载:
DESC

配置chromedriver的路径(可以不配,项目启动指定路径也可以)

  • linux - 使用终端查看系统的PATH环境变量 - 终端输入:echo $PATH 查看系统的PARH环境变量- DESC- 将chromedriver文件放入PATH环境变量的目录下 - 这里是把下载好的Chromedriver放在了上面表的目录里,里面的chromedriver要放在PATH环境变量的目录下- DESC
  • windows - 配置环境变量 网上很多

也可以都不配置后续只需要指定路径即可

项目构建

创建Springboot项目

这里有很详细的创建方式,而且支持社区版也能用:https://www.opensnn.com/os/article/10000759

添加对应依赖

在pom文件添加对应依赖

  1. <dependency>
  2. <groupId>org.seleniumhq.selenium</groupId>
  3. <artifactId>selenium-java</artifactId>
  4. <version>4.22.0</version>
  5. </dependency>
添加简单的demo案例
  1. public class seleniumDemo {
  2. public static void main(String[] args) throws IOException {
  3. // 设置ChromeDriver路径,后面改成自己下载好的chromedriver,指定到chromedriver文件夹里面的chromedriver文件
  4. System.setProperty("webdriver.chrome.driver", "/usr/local/bin/chromedriver");
  5. // 创建ChromeDriver实例
  6. WebDriver driver = new ChromeDriver();
  7. // 打开网页
  8. driver.get("https://www.baidu.com");
  9. // 输出网页标题
  10. System.out.println("Title: " + driver.getTitle());
  11. // 关闭浏览器
  12. driver.quit();
  13. }
  14. }
发现报错

DESC

点击

DESC

发现版本不对,既有3.141的版本也有4.22的版本
DESC

解决 org.openqa.selenium.internal/Require

将之前的
DESC

修改成

DESC

最终效果

删除后再重新导入
DESC
运行程序,结果

DESC
转载自开思通智网:https://www.opensnn.com/os/article/10000982


本文转载自: https://blog.csdn.net/Dd_ddc/article/details/140294071
版权归原作者 Dd_ddc 所有, 如有侵权,请联系我们删除。

“从零开始使用Springboot,selenium进行爬虫”的评论:

还没有评论