0


python selenium.webdriver 爬取政策文件

文章目录

获取文章链接

获取中央人民政府网站链接,进入国务院政策文件库,分为国务院文件和部门文件(发改委、工信部、交通运输部、市场监督局、商务部等)
在这里插入图片描述
搜索关键词——汽车,即可得到按照 相关度 或者 时间 排列的政策文件。
在这里插入图片描述

批量爬取政策文件

批量获取文件链接并存入列表

应用selenium爬取文件信息

利用xpath定位链接、索引号、标题、发文机关、发文字号、主题分类、成文日期、发布日期、文件内容等信息。

右侧通过光标定位各部分信息,右键

标签: python selenium 爬虫

本文转载自: https://blog.csdn.net/weixin_46530492/article/details/131745969
版权归原作者 Cachel wood 所有, 如有侵权,请联系我们删除。

“python selenium.webdriver 爬取政策文件”的评论:

还没有评论