爬虫 - overfit.cn

Selenium简单基础详解（II）

overfit同步小助手 2023-03-29 03:07:48 0 收藏

毕业设计基于大数据的社交平台数据爬虫舆情分析可视化系统

🔥 这两年开始毕业设计和毕业答辩的要求和难度不断提升，传统的毕设题目缺少创新和亮点，往往达不到毕业答辩的要求，这两年不断有学弟学妹告诉学长自己做的项目系统达不到老师的要求。为了大家能够顺利以及最少的精力通过毕设，学长分享优质毕业设计项目，今天要分享的是🚩基于大数据的社交平台数据爬虫舆情分析可视化

overfit同步小助手 2023-03-29 03:04:42 0 收藏

selenium之下拉选择框

一、前言selenium的下拉选择框。我们通常会遇到两种下拉框，一种使用的是html的标签select，另一种是使用input标签做的假下拉框。后者我们通常的处理方式与其他的元素类似，点击或使用JS等。而对于前者，selenium给了有力的支持，就是Select类。进行测试的网站：http://sa

overfit同步小助手 2023-03-29 02:08:36 0 收藏

selenium 解决滑块验证的问题,自动化登录12306中国铁路网

selenium 解决滑块验证的问题。简介对于大部分玩爬虫或者学习爬虫的人来说，验证码毫无疑问是最烦的，但也是相比较而言也是不叫容易破解的反爬虫，但也需要费点脑筋。接下来给大家分享一个滑块验证的解决办法，希望能给大家带来帮助！！网站我也是找了好久才找到一个有滑块的验证网址。。不好找啊！！！或不多少，

overfit同步小助手 2023-03-29 00:07:37 0 收藏

R语言爬虫实例初学者自用

本文记录了使用rvest & RSelenium 包进行爬虫与网页渲染的相关知识点及本人的编程操作过程。涉及到基本爬取操作、爬取缺失部分如何处理、操作网页过滤等步骤。

overfit同步小助手 2023-03-28 23:08:13 0 收藏

Python爬虫（5）-selenium用显式等待、隐式等待、强制等待，解决反复爬取网页时无法定位元素问题

Python爬虫（5）-selenium用显式等待、隐式等待、强制等待，解决加载时长过长、反复爬取网页时无法定位元素问题

overfit同步小助手 2023-03-28 19:07:37 0 收藏

提升Python代码性能的六个技巧

🗿 hello大家好啊，我是作家桑。本文为大家介绍提升 Python 代码性能的六个技巧，希望大家看完有所收获。

overfit同步小助手 2023-03-28 15:07:00 0 收藏

4.网络爬虫—Post请求(实战演示)

POST请求和GET请求的区别（1）post请求更安全不会作为url的一部分，不会被缓存、保存在服务器日志、以及浏览器浏览记录中，get请求的是静态资源，则会缓存，如果是数据，则不会缓存（2）post请求发送的数据更大get请求有url长度限制，http协议本身不限制，请求长度限制是由浏览器和web

overfit同步小助手 2023-03-24 01:03:14 0 收藏

学习笔记：python中Selenium自动化测试网页运行状态

1.第一个脚本实现打开网页并定位元素，搜索，显示结果。import unittestfrom selenium import webdriverfrom selenium.webdriver.common.keys import Keysclass PythonOrgSearch(unittest.

overfit同步小助手 2023-03-23 21:07:40 0 收藏

python爬虫的学习总结

selenium，多线程，多进程，爬取需要登录的网站

overfit同步小助手 2023-03-23 20:07:42 0 收藏

Selenium获取浏览器Network数据包

我的博客：acsec.xyz微信公众号: Ac sec一.概述我们有时候在爬取jsp动态网站时，发现爬取的数据是不完整的。这时候我们就要获取浏览器F12里面的Network数据包，这样才能得到完整的数据。下面我们用python的Selenium模块配合Browsermob-Proxy抓取Networ

overfit同步小助手 2023-03-23 20:07:30 0 收藏

Python爬虫 —— 使用BeautifulSoup4解析HTML文档

我们来聊聊BS4是个啥，它能干啥，BS4是一个从HTML和XML文件中提取数据的python库，它可以将复杂HTML文件转换为一个复杂的树形结构，这棵树的每一个结点都是Python对象，所有对象都可以归纳为4类，这四个对象能干啥呢？点进来看看吧

overfit同步小助手 2023-03-23 19:06:44 0 收藏

Python爬虫（4）-Selenium模拟鼠标操作

overfit同步小助手 2023-03-15 07:06:00 0 收藏

1.认识网络爬虫

1.认识网络爬虫网络爬虫爬虫的合法性HTTP协议请求与响应(重点)网络爬虫爬虫的全名叫网络爬虫，简称爬虫。他还有其他的名字，比如网络机器人，网络蜘蛛等等。爬虫就好像一个探测机器，它的基本操作就是模拟人的行为去各个网站溜达，点点按钮，查查数据，或者把看到的信息背回来。就像一只虫子在一幢楼里不知疲倦地爬

overfit同步小助手 2023-03-13 02:01:33 0 收藏

Java爬虫Selenium+Java+ChromeDriver【抓取百度信息】

是一个模拟浏览器操作的工具，背后有google 维护源代码，支持全部主流浏览器，支持主流的编程语言，包括:java,Python,C#,PHP,Ruby,等，在本项目上使用的Java语言。使用selenium是需要浏览器的配合, chromeDriver,是谷歌浏览器的一个驱动, selenium借

overfit同步小助手 2023-03-11 14:05:55 0 收藏

Selenium爬虫

判断此定位中的value属性中是否包含text_的内容 text_to_be_present_in_element_value(locator, text_)自动化脚本是由程序去执行的，因此有时候打印的错误信息并不是十分明确。设置的时间单位为秒，例如implicitly_wait(30)，意思是超过

overfit同步小助手 2023-03-09 09:06:12 0 收藏

Python爬虫Selenium手动接管Edge爬取裁判文书网“环境污染”数据（Mac环境）

overfit同步小助手 2023-03-07 18:06:33 0 收藏

PyCharm使用教程（详细版 - 图文结合）

目录一、创建项目二、运行三、错误提示四、安装三方包PyCharm的使用贯穿整个Python的学习，所以单独拿出来出教程不合适，说多了对于新手来说也还是不明白，这里我们先从学习开始前大家需要用到PyCharm的一些功能讲起，后面的python视频教程中我们会带着给大家讲更高级一点的用法。上一节课我们已

overfit同步小助手 2023-02-28 11:05:36 0 收藏

拯救了大批爬虫程序员，因为一个简单的神器

相信大家应该都写过爬虫，简单的爬虫只需要使用 requests 即可。遇到复杂的爬虫，就需要在程序里面加上请求头和参数信息。这其实是一个很简单的程序，但是可以解决我们写代码过程中的一个痛点，提高我们写代码的效率。今天给大家介绍一个神器，可以自动地将浏览器的请求头信息解析为我们爬虫需要的代码。每次都需

overfit同步小助手 2023-02-21 10:05:37 0 收藏

selenium超详解

一、Selenium + PhantomJS | Chrome | Firefox1、Selenium概述定义开源的Web自动化测试工具特点可根据指令操控浏览器只是工具，必须与第三方浏览器结合使用安装Linux: sudo pip3 install seleniumWindows: python

overfit同步小助手 2023-02-17 09:06:16 0 收藏