0


通过BeautifulSoup获取【领域赛道--大数据与算法】top100用户

文章目录

前言

博主空空star主页空空star的主页

大家好,我是空空star,本篇给大家分享一下

《通过BeautifulSoup获取【领域赛道--大数据与算法】top100用户》

介绍

BeautifulSoup是一个Python第三方库,用于从HTML或XML等文档中提取数据。它可以自动解析HTML页面,并根据标签和属性等条件提取所需的数据,具有高效、灵活、易用等特点,是Python爬虫的重要工具之一。

使用BeautifulSoup,我们可以轻松地遍历HTML页面的标签和属性,并根据需要提取数据。

实现

帖子地址

[2023-06-29]2023博客之星候选–领域赛道–大数据与算法

请求地址

引入模块

import requests
from bs4 import BeautifulSoup

提取代码

defget_usernames():
    usernames =[]
    response = requests.get('https://bbs.csdn.net/topics/616323734')
    res = response.text
    soup = BeautifulSoup(res,'lxml')for item in soup.find_all('a'):
        url = item.get('href')if'https://edu.csdn.net/me/'in url:
            username = url.split('/')[4]
            usernames.append(username)return usernames

程序入口

if __name__ =='__main__':
    users = get_usernames()print(f'获取到的用户数:{len(users)}')print(f'获取到的用户列表:{users}')

提取到的数据

获取到的用户数:100
获取到的用户列表:[‘weixin_42241611’, ‘m0_74396439’, ‘weixin_43871785’, ‘zjjcchina’, ‘weixin_43412762’, ‘u011868279’, ‘weixin_44958787’, ‘weixin_55464238’, ‘baklib’, ‘wr_java’, ‘coder_ljw’, ‘chenwewi520feng’, ‘zuoan1993’, ‘weixin_38093452’, ‘qq_46548855’, ‘qq441540598’, ‘myrealization’, ‘csdnguoyuying’, ‘qq_66485519’, ‘oddrock’, ‘qq_41071754’, ‘m0_68111267’, ‘elon_520’, ‘weixin_39032019’, ‘m0_63613132’, ‘qq_44226094’, ‘zy_dreamer’, ‘2301_76957510’, ‘binghhb’, ‘weixin_72060925’, ‘kk702392702’, ‘m0_63398413’, ‘wwxdwrn’, ‘s2735365253’, ‘caryxp’, ‘fckbb’, ‘sugar_wolf’, ‘qq_42958831’, ‘qq_44766883’, ‘weixin_66151870’, ‘liqiu0913’, ‘m0_56069910’, ‘m0_60025795’, ‘qq_62839589’, ‘weixin_43894652’, ‘sun123234’, ‘oceanbasegfbk’, ‘dzk666123’, ‘weixin_42204569’, ‘weixin_42439274’, ‘weixin_44832243’, ‘qq_43714918’, ‘xiaoluobutou’, ‘jane9872’, ‘leread’, ‘steven_zhangxue’, ‘wangjun861205’, ‘yingjiayu12’, ‘qq_32727095’, ‘tikitian’, ‘weixin_47276960’, ‘jasonchen1224’, ‘cfy1226’, ‘ironmanjay’, ‘qq_66345100’, ‘actiontech’, ‘weixin_42011858’, ‘qq_46373141’, ‘weixin_43434369’, ‘w_chuanqi’, ‘stormsunshine’, ‘weixin_62633072’, ‘ziye_190’, ‘apr15’, ‘programnovice’, ‘qq_74310471’, ‘m0_73258399’, ‘weixin_48804451’, ‘liang921119’, ‘shangguanxiu’, ‘w2915w’, ‘jnrjian’, ‘weixin_73142957’, ‘m0_63488627’, ‘qq_44804713’, ‘so_zxn’, ‘qq_52097561’, ‘m0_73888323’, ‘2301_76549664’, ‘weixin_43830137’, ‘liuliangcan’, ‘m0_62609939’, ‘weixin_42690036’, ‘m0_63951142’, ‘weixin_43894455’, ‘qq_64580912’, ‘u014571143’, ‘weixin_44904816’, ‘yiluohan0307’, ‘qq_43778500’]

总结

最后

如果您不知道如何支持我,
InsCode AI列了一些支持博主的句子供您参考:

博主写的文章很有深度,收获了很多知识。
博主的写作风格幽默风趣。
博主勇于分享自己的经验和教训,让初学者从中受益匪浅。
博主的思想独到,文章读起来让人格外振奋。
博主为人很好,乐于助人,回复读者的问题也非常及时。
博主的专业知识非常全面,无论是哪个领域的问题都能给出详细的解答。


本文转载自: https://blog.csdn.net/weixin_38093452/article/details/131456914
版权归原作者 空空star 所有, 如有侵权,请联系我们删除。

“通过BeautifulSoup获取【领域赛道--大数据与算法】top100用户”的评论:

还没有评论