爬虫 - overfit.cn

python金融分析小知识(11)——python爬虫工具Postman神器的使用

Hello 大家好，我是一名新来的金融领域打工人，日常分享一些python知识，都是自己在学习生活中遇到的一些问题，分享给大家，希望对大家有一定的帮助！相信很多小伙伴在使用python的使用会用来爬取一些网站上常见的数据，在做金融分析的时候如果没有数据的话我们可以去网上爬取，那么今天我要介绍的一个最

overfit同步小助手 2023-04-01 08:07:47 0 收藏

技术学习：Python（21）｜爬虫篇｜selenium自动化操作浏览器

Selenium是一个用于Web应用程序测试的工具。Selenium测试直接运行在浏览器中，就像真正的用户在操作一样。支持的浏览器包括IE（7, 8, 9, 10, 11），Mozilla Firefox，Safari，Google Chrome，Opera，Edge等。这个工具的主要功能包括：测试

overfit同步小助手 2023-04-01 04:07:43 0 收藏

网络爬虫js逆向解决网站登录RSA加密问题，不使用selenium如何实现登录，session维持登录状态请求爬取

记录中大网校破解登录后爬取的方法：使用工具：打码平台（超级鹰）分析此请求，得知没有data，保持状态登录需要服务器知道是这个用户对应请求的相应验证码，所以要用session来维护状态获取到后验证码保存下来。

overfit同步小助手 2023-04-01 03:09:17 0 收藏

【Python爬虫 • selenium】selenium4新版本自动获取驱动的常见问题

关于上次发布的文章《【Python爬虫 • selenium】selenium4新版本使用指南》很多人反馈说自动获取的驱动会导致闪退，本次文章给出详细配置。首先说一下大家闪退的问题。我在低版本的python中，安装selenium，发现安装的是旧版本，并不是selenium4的版本，就导致用法还是s

overfit同步小助手 2023-04-01 02:06:43 0 收藏

【小知识点】爬虫训练场项目，Python Flask 模板更新，每次都要重新服务

在项目实战的时候，由于我们使用的是 Python Flask 框架，每次修改前端 HTML 页面之后，都要重启一下 flask 服务，然后查看效果，非常不方便。实战中还可以使用 manager 管理工具实现自动刷新页面，或者安装第三方模块 livereload 进行实现，后续用到这部分内容，我们继续

overfit同步小助手 2023-04-01 01:03:06 0 收藏

爬取公布的招聘信息（selenium实现）

目录1 爬虫 1.1 爬虫的概念 1.2爬虫的工作原理 1.3爬虫的基本流程 2 基本操作 2...

overfit同步小助手 2023-03-31 21:07:16 0 收藏

selenium爬虫如何绕过反爬，看这一篇文章就足够了

参考维基百科解释webrtc：WebRTC，名称源自网页即时通信（英语：Web Real-Time Communication）的缩写，是一个支持网页浏览器进行实时语音对话或视频对话的API。它于2011年6月1日开源并在Google、Mozilla、Opera支持下被纳入万维网联盟的W3C推荐标准

overfit同步小助手 2023-03-31 17:07:35 0 收藏

网络数据爬虫（scrapy+selenium）实现页面跳转及文件/附件下载

一、基于scrapy的基本架构搭建（往期博文中已有基本介绍，可参考：）二、selenium实现自动跳转“下一页”：1、selenium简介：一种自动化测试工具，可以模拟人来操作浏览器，执行效率有时候还不如人快，因为需要浏览器页面加载完成才能操作，对网速要求严格，可以用于重复性的操作。2、需求：爬取条

overfit同步小助手 2023-03-31 17:07:17 0 收藏

linux系统下如何部署selenium爬虫程序

随着互联网时代的到来，越来越多的企业热衷于通过大数据比对的方法获取一些有价值的行业信息，进而增加自己的企业竞争力。如何获取或者大面积收集有用的行业信息，是每一个数据公司都要考虑的事情。7 options.add_experimental_option(‘excludeSwitches’, [‘ena

overfit同步小助手 2023-03-31 13:07:04 0 收藏

07爬虫-selenium其它使用方法1，标签切换、窗口切换

selenium标签页的切换获取当前所有的标签页的句柄构成的列表 current_windows = driver.window_handles根据标签页句柄列表索引下标进行切换 driver.switch_to.window(current_windows[0])参考代码示例：#coding:u

overfit同步小助手 2023-03-31 11:07:07 0 收藏

Selenium基础（爬虫基础_2）

Selenium基础（爬虫基础了解_2）

overfit同步小助手 2023-03-31 11:07:02 0 收藏

linux下使用selenium调用谷歌浏览器的一些问题

# 谷歌浏览器版本查看google-chrome -version # 对应的chromedriver版本查看chromedriver -version版本对应的下载，参考谷歌chromedriver对应版本下载文章或chromedriver download 下载完成后可以选择设置成环境

overfit同步小助手 2023-03-31 05:07:33 0 收藏

大规模 Web 数据采集的终极开源方案 - PulsarR

PulsarR 是大规模采集 Web 数据的终极开源方案，可满足几乎所有规模和性质的网络数据采集需要。大规模提取 Web 数据非常困难。网站经常变化并且变得越来越复杂，这意味着收集的网络数据通常不准确或不完整，PulsarR 开发了一系列尖端技术来解决这些问题。

overfit同步小助手 2023-03-31 05:05:56 0 收藏

C# Selenium chromedriver 隐藏Devtool控制台窗口

爬取网页信息时，使用了C# + Selenium (WebDriver.dll) +chromedriver + Chrome除了chromedriver控制台窗口(可以通过CDS.HideCommandPromptWindow = true隐藏)，还有出现一个谷歌浏览器的Devtool调试工具的控

overfit同步小助手 2023-03-31 04:07:50 0 收藏

python selenium 大众点评餐厅信息+用户评论爬虫

这次爬取的目标是大众点评里餐厅的信息以及用户的评论。大众点评的反爬内容比较丰富,这里也只是记录了如何通过selenium模拟访问大众点评,以及大众点评的woff文件构建字典并对加密文字进行替换。目标url='http://www.dianping.com/shop/G7RgscHLjDjXY9hg'

overfit同步小助手 2023-03-31 00:07:28 0 收藏

python 爬虫 | selenium换页问题

我最近遇到一个问题我的selenium无法换页，我的代码如下。chromeOptions = webdriver.ChromeOptions()chromeOptions.add_experimental_option('excludeSwitches', ['enable-automation']

overfit同步小助手 2023-03-30 23:07:38 0 收藏

python爬虫（七）--------selenium自动化

窗口切换 switch_to_window(窗口ID) switch_to.window(窗口ID) (python3.8以上版本都支持，python3.7只支持后者写法)导包：from selenium.webdriver.support import expected_conditions as

overfit同步小助手 2023-03-30 23:07:32 0 收藏

网络爬虫爬取时，被封的原因以及防止被封IP策略

网络爬虫爬取时，被封的原因以及防止被封IP策略：策略一：建立IP池。策略二：使用延时爬取

overfit同步小助手 2023-03-30 18:09:12 0 收藏

Python爬虫进阶 - win和linux下selenium使用代理

selenium各种情况讨论。双系统各自的selenium配置和基本使用，以及selenium在服务器以有界面方式运行。

overfit同步小助手 2023-03-30 17:07:35 0 收藏

Selenium用法详解【简介入门】【JAVA爬虫】

Selenium是一个用于Web应用程序测试的工具。Selenium测试直接运行在浏览器中，就像真正的用户在操作一样。支持的浏览器包括IE（7, 8, 9, 10, 11）， Mozilla Firefox，Safari，Google Chrome，Opera，Edge 等。这个工具的主要功能包

overfit同步小助手 2023-03-30 10:08:12 0 收藏