爬虫 - overfit.cn

基于python在线考试系统设计与实现

主要讲解本系统设计到的文件和所存在路径等默认账号admin 密码123456后台管理系统框架路由文件：这是开源的后台管理框架，不要动，下面的这些文件供参考，了解即可下面是后台管理系统首页（程序所在位置：views.py）/htviews.ht后台登录页面ht/main登录后，后台管理首页ht/lef

overfit同步小助手 2023-08-26 11:03:37 0 收藏

selenium 爬虫

springboot 使用selenium动态爬取网页数据

overfit同步小助手 2023-08-24 10:06:29 0 收藏

从零开始学习 Java：简单易懂的入门指南之爬虫（十六）

手机号的正则表达式:1[3-9]\d{9}只看左括号，不看有括号，按照左括号的顺序，从左往右，依次为第一组，第二组，第三组等等。把下面文本中的座机电话，邮箱，手机号，热线都爬取出来。

overfit同步小助手 2023-08-24 10:02:36 0 收藏

Python之爬虫基础

网络爬虫（又称为网页蜘蛛，网络机器人，在FOAF社区中间，更经常的称为网页追逐者），是一种按照一定的规则，自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。

overfit同步小助手 2023-08-24 09:03:02 0 收藏

7种有效安全的网页抓取方法，如何避免被禁止？

网页抓取是一种从互联网上抓取网页内容的过程，但在网络抓取种相信您也经常遇到障碍？尤其是做跨境业务的，在抓取国外的网站时更有难度。但我们站在您的立场上，提供七种有效的方法来进行网页抓取而不被阻止，最大限度地降低网站禁令的风险，并帮助您应对相关风险。

overfit同步小助手 2023-08-24 06:07:38 0 收藏

【Twitter爬虫】Twitter网络爬虫

从2月9日起，Twitter不再支持免费访问Twitter API，继续使用Twitter API支付较高的费用。下面将介绍一种绕过Twitter API爬取推文的方式。首先介绍一下Selenium Webdriver，这是一款web自动化测试框架，可以利用它在web浏览器上模拟。先在网页上登陆自己

overfit同步小助手 2023-08-23 03:02:42 0 收藏

python | 傻瓜式一键搭建图片验证码识别接口

overfit同步小助手 2023-08-22 18:07:51 0 收藏

Java学习笔记：爬虫-操作动态网页的Selenium

爬虫入门容易，如果精通则需要是优秀的网站开发者（前端+后端）。Selenium可以自动启动一个浏览器、打开网页，可以用程序操作页面元素，也可以获得浏览器当前页面动态加载的页面元素。3、将chromeDriver放在chrome浏览器根目录下，它负责对Chrome浏览器执行自动化操作。有些网页内容是在

overfit同步小助手 2023-08-22 00:06:19 0 收藏

IP代理技术在网络安全与爬虫应用中的优势与挑战

防止DOS和DDOS攻击：IP代理可作为反向代理部署，分担流量压力，缓解DOS和DDOS攻击对服务器造成的影响。提高爬虫稳定性：使用IP代理可以轮换多个IP地址，减少单个IP被目标网站封禁的可能性，提高爬虫的稳定性。根据任务需求选择：根据爬虫任务的具体需求，合理选择HTTP代理或SOCKS代理，以达

overfit同步小助手 2023-08-21 12:08:11 0 收藏

【100天精通python】Day41：python网络爬虫开发_爬虫基础入门

网络爬虫（Web Crawler），是一种自动化程序，用于在互联网上浏览和抓取信息。爬虫可以遍历网页，收集数据，提取信息，以便于进一步处理和分析。网络爬虫在搜索引擎、数据采集、信息监测等领域发挥着重要作用。1.1 工作原理初始URL选择：爬虫从一个或多个初始URL开始，这些URL通常是你希望开始爬

overfit同步小助手 2023-08-21 09:02:41 0 收藏

爬虫-------selenium

【代码】爬虫-------selenium。

overfit同步小助手 2023-08-20 03:06:00 0 收藏

从HTTP代理到Socks5代理：网络安全与爬虫的进化之路

数据加密传输是Socks5代理的一大优势，它提供数据的加密传输功能，保障数据在传输过程中的安全性，为网络安全提供更全面的保护。复杂应用场景选择Socks5代理：在需要支持UDP协议、实时数据传输和加密传输等复杂场景下，Socks5代理是更为智能的选择。数据加密传输：Socks5代理提供数据的加密传输

overfit同步小助手 2023-08-19 14:07:54 0 收藏

逆向爬取实战分析：iBox数字交易平台PC端实战（源码开源）

overfit同步小助手 2023-08-19 14:05:18 0 收藏

探索不同类型的代理服务器 (代理 IP、socks5 代理）及其在网络安全与爬虫中的应用

相比之下，SK5代理则是一种虚拟代理技术，通过在客户端和目标服务器之间建立虚拟连接来实现代理功能，从而降低了代理服务器的负担。通过合理配置和使用代理，可以提高网络安全性，实现稳定高效的数据采集，为技术人员提供更多可能性与挑战。首先，代理可以充当反向代理，将客户端请求转发到后端服务器，有效分担了后端服

overfit同步小助手 2023-08-19 09:09:00 0 收藏

作为爬虫工程师，自动化和抓包你说不了解的selenium采集内容篇！

作为爬虫工程师，掌握Selenium采集是非常有用的，因为有些网站采用了动态加载、javascript渲染或AJAX技术，这些技术使得使用传统的静态HTML解析库难以获取到完整的数据。Selenium是一个自动化测试工具，它可以模拟用户在浏览器中的交互行为，包括点击、滚动、输入等操作。动态网页采集：

overfit同步小助手 2023-08-19 01:07:24 0 收藏

Python爬虫——selenium_元素定位

selenium_元素定位

overfit同步小助手 2023-08-18 13:06:27 0 收藏

Python requests库使用详解

今天继续给大家介绍Python 爬虫相关知识，本文主要内容是Python requests库使用详解。一、Python requests库简介二、requests库常用方法三、response对象使用

overfit同步小助手 2023-08-17 16:02:44 0 收藏

基于Selenium技术方案的爬虫入门实践

本文介绍了如何使用Selenium技术进行爬虫实践，以百度网页查询为例。首先，我们将学习如何在Chrome浏览器开发者模式下获取元素。接下来，我们将指导您安装Selenium和Chromedriver。最后，我们将通过一个简单的示例来演示如何模拟百度搜索"Python"的过程。

overfit同步小助手 2023-08-16 22:06:37 0 收藏

业务安全分析第19期 | 今年暑假，博物馆的门票为什么抢不到?

识别客户端的设备指纹是否合法，是否存在注入、hook、模拟器等风险，识别客户端的设备指纹是否合法，快速识别刷机改机、Root、越狱、劫持注入等风险。也有博物馆要求，7天内3次、30天内5次取消预约或预约后不进场的账号，将被关进“小黑屋”30天，不准预约，以防范“黄牛”反复利用手里的身份信息。针对“黄

overfit同步小助手 2023-08-16 14:08:29 0 收藏

selenium自动翻页爬取数据信息

自动爬虫

overfit同步小助手 2023-08-16 07:06:16 0 收藏