实习打杂,经常有需求要爬数据,今天试了试rpa好不好用。
软件
我用到的是微软的Power Automate
简单案例爬取大众点评
需求
爬取大众点评前十页的商家名称,价格,区域,共150条
详细教程
- 打开点击左上角新建流,创建一个新的流
- 新建一个窗口实例,即要爬取的页面
填入初始想要爬取的url,如果url中有%,需要添加转义符,两个%就可以转译为一个%
- 定义爬取页面的规则,即指定爬取页面的哪些数据
此处,回到之前爬取的页面,会自动弹窗,并出现红色框让你选定想要提取的内容
鼠标右击所要提取的内容,会加入到选定规则中,ps:可能会卡住没反应,多点几次。
把想要的信息都重复上述步骤,所被提取到的信息,会绿虚线标定,同时全部加入规则
此时在框第二个商家,一旦框中相同的列表项,就会自动生成全部
- 翻页
红框在翻页按钮右击,选择【将元素设置为页导航】,预览中就会出现提示
点击完成,回到配置的初始页面,可配置所要选取的页数,也可以选择生成文件类型,此处我选了十页,存储到excel中
点击保存,左上角点击运行
会自动打开浏览器,自动翻页,最后保存在excel表格中,再根据自己需求,调一下列名、列宽、列长等即可~
版权归原作者 Stecolin 所有, 如有侵权,请联系我们删除。