爬虫 - overfit.cn

爬虫学习--17.反爬斗争 selenium（2）

鼠标行为链有时候在页面中的操作可能要有很多步，那么这时候可以使用鼠标行为链类ActionChains来完成。比如现在要将鼠标移动到某个元素上并执行点击事件。

overfit同步小助手 2024-06-06 17:05:20 0 收藏

网络爬虫——python爬取豆瓣评论

网络爬虫，又被称为网络蜘蛛（Web Spider）、网络机器人等。它根据网页地址（URL）爬取网页内容，网页地址（URL）就是我们在浏览器中输入的网站链接。例如：https://www.baidu.com；网络爬虫不仅能够复制网页信息和下载音视频，还可以做到网站的模拟登录和行为链执行。由于需要爬取的

overfit同步小助手 2024-06-06 01:02:11 0 收藏

【爬虫实战】——Python爬取天气信息

该篇将进行城市天气信息爬取实战，主要涉及到网页url解析、正则表达匹配等技术，可用作网页爬虫练手项目。

overfit同步小助手 2024-06-05 16:02:06 0 收藏

如何利用工作流自定义一个AI智能体

今天再来介绍一个平台扣子，扣子是字节跳动开发的一站式AI开发平台，为用户提供便捷、高效的工具，帮助他们快速创建、调试和优化AI聊天机器人。无论用户是否具备编程背景，都能通过扣子平台轻松构建各种基于AI模型的问答机器人。

overfit同步小助手 2024-06-05 16:01:41 0 收藏

selenium模拟鼠标滚动

【代码】【无标题】

overfit同步小助手 2024-06-04 15:05:52 0 收藏

Python应用-Scrapy爬虫之拉勾网招聘数据分析（4，5关）

本关任务：使用Pandas结合Matplotlib对数据进行可视化展示(柱状图)。

overfit同步小助手 2024-06-04 14:02:16 0 收藏

Python爬虫基础之Selenium详解_python selenium

from selenium import webdriverfrom selenium.webdriver.common.by import Bybrowser= webdriver.Chrome()url = ‘https://www.baidu.com’browser.get(url)butto

overfit同步小助手 2024-06-03 18:05:56 0 收藏

【爬虫基础】第21讲解决问题：selenium打开浏览器自动关闭

在学习的时候，遇到使用selenium打开浏览器驱动时，没有写关闭代码，浏览器也会自动关闭，导致在学习不是很方便，代码如下。重新安装selenium，并选则版本：pip install selenium==3.3.0。我原来使用的是4.19.0版本，把版本降到到3.0即可。从新执行源代码成功，不再一

overfit同步小助手 2024-06-03 13:06:04 0 收藏

Python 网络爬虫技巧分享：优化 Selenium 滚动加载网易新闻策略

网络爬虫在数据采集和信息获取方面发挥着重要作用，而滚动加载则是许多网站常用的页面加载方式之一。针对网易新闻这样采用滚动加载的网站，如何优化爬虫策略以提高效率和准确性是一个关键问题。本文将分享如何利用 Python 中的 Selenium 库优化滚动加载网易新闻的爬虫策略，以便更高效地获取所需信息。

overfit同步小助手 2024-06-03 05:06:25 0 收藏

Python爬虫技术深度解析与实战案例

Python作为一种功能强大且易于学习的编程语言，在爬虫领域有着广泛的应用。本文将详细介绍Python爬虫技术的基本原理、核心组件，并通过一个实战案例展示Python爬虫的实际应用。通过实战案例的演示，我们可以看到Python爬虫在实际应用中的强大功能。然而，在使用Python爬虫时，我们也需要遵守

overfit同步小助手 2024-06-03 01:03:41 0 收藏

python爬虫selenium登录豆瓣案例详解，Python面试宝典pdf

学好 Python 不论是就业还是做副业赚钱都不错，但要学会 Python 还是要有一个学习规划。最后大家分享一份全套的 Python 学习资料，给那些想学习 Python 的小伙伴们一点帮助！

overfit同步小助手 2024-06-02 05:06:15 0 收藏

Python网页处理与爬虫实战：使用Requests库进行网页数据抓取

request 库支持非常丰富的链接访问功能，包括：国际域名和 URL 获取、HTTP 长连接和连接缓存、HTTP 会话和Cookie 保持、浏览器使用风格的SSL 验证、基本的摘要认证、有效的键值对Cookie 记录、自动解压缩、自动内容解码、文件分块上传、HTTP(S) 代理功能、连接超时

overfit同步小助手 2024-06-01 12:02:30 0 收藏

『scrapy爬虫』03. 爬取多个页面（详细注释步骤）

overfit同步小助手 2024-05-31 22:02:19 0 收藏

使用Python进行网络爬虫Scrapy框架的实践

进入到myspider目录，并创建一个新的爬虫。这将在spiders目录下创建一个名为example.py的Python文件，其中包含了一个基本的爬虫示例。打开example.py文件，并编辑其中的start_urls和parse方法，以定义你要爬取的网站和如何解析网页的方式。# 在这里编写解析网页

overfit同步小助手 2024-05-29 20:02:24 0 收藏

B站热门视频弹幕情感分析（含B站视频弹幕爬虫，可用于爬取任意视频的弹幕）已修改，可直接运行

随着自媒体时代的兴起和视频分享网站的普及，弹幕成为了一种流行的实时评论形式。在哔哩哔哩弹幕视频网站，弹幕语言的作用不容小觑。弹幕作为一种实时评论，涵盖了用户观看视频时的情感和看法，成为了视频内容的反馈和补充，丰富了视频制作和观看的体验。在本次项目中，以B站著名UP主木鱼水心的水浒传合集共50个分P的

overfit同步小助手 2024-05-29 17:02:30 0 收藏

某东，m端滑块，h5st4.2,4.3,4.7

京东、h5st、京东滑块

overfit同步小助手 2024-05-29 13:03:09 0 收藏

人工智能|网络爬虫——用Python爬取电影数据并可视化分析

1.2016年-2019年电影数量逐渐增大，2019年达到最大值，从2020年开始迅速逐年下降。2.发布电影数量最多的国家是中国和美国。3.电影类型最多的剧情片。4.电影片长呈正态分布，且片长和评分呈正相关关系。

overfit同步小助手 2024-05-29 11:01:34 0 收藏

基于大数据+Spark电力能耗数据分析与可视化平台设计与实现

随着经济的发展和人口的增加，能源消耗也在不断增加。电力作为人们生产和生活中不可或缺的一部分，对于能源消耗的贡献也非常大。传统的电力供应模式已经无法满足人们对电力的需求，同时也带来了环境污染等问题。如何优化电力供应模式，提高能源利用效率，成为了当前亟待解决的问题。而电力能耗数据分析正是解决这一问题的有

overfit同步小助手 2024-05-29 09:03:41 0 收藏

网易云爬虫评论（Selenium 方式）——Part 2 缝缝补补（又是失败但进步的一天）

接前文所述，使用selenium抓取网易云界面出现代码返回不稳定的问题，当时我以为是网络问题，换了3台电脑测试后依旧存在，则说明前述代码的数据抓取成功是小概率事件，找问题!

overfit同步小助手 2024-05-28 21:05:49 0 收藏

【保姆级爬虫】微博关键词搜索并获取博文和评论内容（python+selenium+chorme）

非常详细的微博内容以及评论的爬取，包括怎么展开文章，怎么对网页和评论翻页

overfit同步小助手 2024-05-28 19:01:59 0 收藏