0


rpa实现简单爬虫

实习打杂,经常有需求要爬数据,今天试了试rpa好不好用。

软件

我用到的是微软的Power Automate

简单案例爬取大众点评

需求

爬取大众点评前十页的商家名称,价格,区域,共150条

详细教程
  • 打开点击左上角新建流,创建一个新的流

  • 新建一个窗口实例,即要爬取的页面

填入初始想要爬取的url,如果url中有%,需要添加转义符,两个%就可以转译为一个%

  • 定义爬取页面的规则,即指定爬取页面的哪些数据

此处,回到之前爬取的页面,会自动弹窗,并出现红色框让你选定想要提取的内容

鼠标右击所要提取的内容,会加入到选定规则中,ps:可能会卡住没反应,多点几次。

把想要的信息都重复上述步骤,所被提取到的信息,会绿虚线标定,同时全部加入规则

此时在框第二个商家,一旦框中相同的列表项,就会自动生成全部

  • 翻页

红框在翻页按钮右击,选择【将元素设置为页导航】,预览中就会出现提示

点击完成,回到配置的初始页面,可配置所要选取的页数,也可以选择生成文件类型,此处我选了十页,存储到excel中

点击保存,左上角点击运行

会自动打开浏览器,自动翻页,最后保存在excel表格中,再根据自己需求,调一下列名、列宽、列长等即可~

标签: rpa 爬虫

本文转载自: https://blog.csdn.net/weixin_42656797/article/details/131417573
版权归原作者 Stecolin 所有, 如有侵权,请联系我们删除。

“rpa实现简单爬虫”的评论:

还没有评论