python网络爬虫基于selenium爬取斗鱼直播信息( 二 ) _网络爬虫

四、完整代码from selenium import webdriverfrom time import sleepimport json#创建一个类class Douyu():def __init__(self):self.url = 'https://www.douyu.com/directory/all'#解析数据的函数def parse(self):#强制等待两秒，等待页面数据加载完毕sleep(2)li_list = self.bro.find_elements_by_xpath('//*[@id="listAll"]/section[2]/div[2]/ul/li')#print(len(li_list))data_list = []for li in li_list:dic_data = https://www.isolves.com/it/cxkf/yy/Python/2022-03-15/{}dic_data['title'] = li.find_element_by_xpath('./div/a/div[2]/div[1]/h3').textdic_data['name'] = li.find_element_by_xpath('./div/a/div[2]/div[2]/h2/div').textdic_data['art_type'] = li.find_element_by_xpath('./div/a/div[2]/div[1]/span').textdic_data['hot'] = li.find_element_by_xpath('./div/a/div[2]/div[2]/span').textdata_list.append(dic_data)return data_list#保存数据的函数def save_data(self,data_list,i):#在当前目录下将数据存为txt文件with open('./douyu.txt','w',encoding='utf-8') as fp:for data in data_list:data = str(data)fp.write(data+'n')print("第%d页保存完成！" % i)# json文件的存法# with open('./可执行文件/可执行文件/chromedriver.exe'self.bro.get(self.url)while i <= page_num:#调用解析函数data_list = self.parse()#调用保存函数self.save_data(data_list,i)try:#定位包含“下一页”字段的按钮并点击button = self.bro.find_element_by_xpath('//span[contains(text(),"下一页")]')button.click()i += 1except:breakself.bro.quit()else:print("输入格式错误！")if __name__ == '__main__':douyu = Douyu()douyu.run()

python网络爬虫基于selenium爬取斗鱼直播信息( 二 )

推荐阅读

中国吉林网|正阳街道万福社区开展国家安全教育街头宣传活动

拳击练习步骤有哪些

奶茶过安检可以不喝吗

「大宗交易」北京大宗交易连涨5年自用买家独宠核心区城市更新项

黑豆哪种心最好黑豆什么芯营养价值高

阿娇晒伤口照片|甜蜜的负担！阿娇晒伤口照片，伤口针脚触目惊心

头伏饺子二伏面是什么意思头伏饺子二伏面三伏

吴亦凡|吴亦凡自爆是个女儿控，我看他见到可爱的小女孩，就忍不住想下手

羽绒棉衣服油渍怎么洗白羽绒棉衣服油渍怎么洗

辛苦考上的公务员，你却告诉我这根本就不是公务员

体育风云传|苏炳添基因有多强，2岁儿子跑步的父亲真传，网友：这是个孩子？

[一加科技]终于盼来！这才是我们想要的一加手机

问董秘|请问2...，投资者提问：董秘好：公司披露过18/19年股权激励费用对利润的影响

“温水煮青蛙”式的生活，有多可怕？温水煮蛙

高达|少年！你真幸福！一出考场就收到妈妈送的高达模型

遥不可及|每个架构师都在研究的康威定律，程序员进阶路上，你思考过吗？

荒郊野史|在韩信和萧何遇害的时候，为何选择袖手旁观？，张良那么足智多谋

【极品飞车视频|学会吃鸡到手软！，和平精英狙击手必备攻略】

菊花和什么搭配着喝最合适,菊花和枸杞起泡有什么功效

历史智慧库|成为一名太监，为何现在多地都有他的后代？，12岁郑和入宫