神剑山庄资源网 Design By www.hcban.com
首先说明一下需要使用的工具以及技术:python3 + selenium
selenium安装方法:pip install selenium
前提:获取自己的qq群成员信息,自己必须是群主或者管理员,然后通过管理页面进入到成员高级管理网页端,就可以对数据进行爬取了!
步骤:
①:首先安装环境 selenium库,selenium是一个自动化库,但是使用它必须用到浏览器驱动,不同的浏览器有不同的驱动,所以需自行下载,我这里是chrome浏览器。
②:运行 程序,然后会需要点击一键登录按钮,点击即可,点击完后,整个页面还未加载全所有的成员信息,所以需要将滚动条下拉至底。
③:等待运行结束,结束后 同目录下就会出现一个xslx文档,里面就是所有的群成员信息
话不多说,上代码就完了!
from selenium import webdriver from time import sleep #1.创建Chrome浏览器对象,这会在电脑上在打开一个浏览器窗口 browser = webdriver.Chrome(executable_path ="D:\chromedownload\chromedriver") #2.通过浏览器向服务器发送URL请求 browser.get("https://qun.qq.com/member.html#gid=951192978") sleep(20) #browser.sleep(3) all_number_nickname = browser.find_elements_by_xpath('//*[@class="list"]/tr/td[3]/span[1]') all_number_name = browser.find_elements_by_xpath('//*[@class="list"]/tr/td[4]/span[1]') all_number_order = browser.find_elements_by_class_name('td-no') all_number_qq = browser.find_elements_by_xpath('//*[@class="list"]/tr/td[5]') all_number_sex = browser.find_elements_by_xpath('//*[@class="list"]/tr/td[6]') all_number_qqage = browser.find_elements_by_xpath('//*[@class="list"]/tr/td[7]') all_number_intime = browser.find_elements_by_xpath('//*[@class="list"]/tr/td[8]') all_number_marks = browser.find_elements_by_xpath('//*[@class="list"]/tr/td[9]') all_number_lastsaytime = browser.find_elements_by_xpath('//*[@class="list"]/tr/td[10]') # for i in [all_number_qq,all_number_nickname,all_number_name,all_number_order,all_number_sex,all_number_qqage,all_number_intime,all_number_marks,all_number_lastsaytime]: # for j in i: # print(j.text) list=[] for k in range(len(all_number_qq)): list.append([]) list[k].append(all_number_qq[k].text) list[k].append(all_number_nickname[k].text) list[k].append(all_number_name[k].text) list[k].append(all_number_order[k].text) list[k].append(all_number_sex[k].text) list[k].append(all_number_qqage[k].text) list[k].append(all_number_intime[k].text) list[k].append(all_number_marks[k].text) list[k].append(all_number_lastsaytime[k].text) import openpyxl def write_excel_xlsx(path, sheet_name, value): index = len(value) workbook = openpyxl.Workbook() sheet = workbook.active sheet.title = sheet_name for i in range(0, index): for j in range(0, len(value[i])): sheet.cell(row=i+1, column=j+1, value=str(value[i][j])) workbook.save(path) print("xlsx格式表格写入数据成功!") book_name_xlsx = 'python小白交流群成员.xlsx' sheet_name_xlsx = 'python小白交流群成员' value = list write_excel_xlsx(book_name_xlsx, sheet_name_xlsx, value)
总结
以上所述是小编给大家介绍的Python获取统计自己的qq群成员信息的方法,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对网站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!
神剑山庄资源网 Design By www.hcban.com
神剑山庄资源网
免责声明:本站文章均来自网站采集或用户投稿,网站不提供任何软件下载或自行开发的软件!
如有用户或公司发现本站内容信息存在侵权行为,请邮件告知! 858582#qq.com
神剑山庄资源网 Design By www.hcban.com
暂无Python获取统计自己的qq群成员信息的方法的评论...
更新日志
2024年09月30日
2024年09月30日
- 孙悦.1996-伙伴【正大国际】【WAV+CUE】
- 纪钧瀚《钢琴阅读时光 雨中书店聆听轻音乐》[FLAC/分轨][399.62MB]
- 证声音乐图书馆《走向自然 疗心爵士乐》[320K/MP3][87.4MB]
- 证声音乐图书馆《走向自然 疗心爵士乐》[FLAC/分轨][184.94MB]
- 陈慧娴.2018-Priscilla-Ism演唱会3CD(2024环球红馆40复刻系列)【环球】【WAV+CUE】
- 郑秀文.1999-我应该得到(国)【华纳】【WAV+CUE】
- 陈家慧.2011-钢琴酒吧2CD【龙吟唱片】【WAV+CUE】
- 证声音乐图书馆《雨季 蓝调吉他 Rainy Blues》[320K/MP3][45.01MB]
- 证声音乐图书馆《雨季 蓝调吉他 Rainy Blues》[FLAC/分轨][109.13MB]
- 赞多《序章》[320K/MP3][45.54MB]
- 许巍.2004-每一刻都是崭新的【步升大风】【WAV+CUE】
- 群星.2024-四方馆影视原声带【韶愔音乐】【FLAC分轨】
- 陈雷.1997-安锁咧【金圆唱片】【WAV+CUE】
- 关淑怡.2013-MY.FAVORITE.SK.3CD【环球】【WAV+CUE】
- Sweety.2006-花言乔语【丰华】【WAV+CUE】