coding=utf-8

“”"
author:lei
function: 虎牙直播爬取
“”"

import time
from selenium import webdriver

class HuYa(object):
def init(self):
self.url = “https://www.huya.com/l”
options = webdriver.ChromeOptions()
options.binary_location = r"D:\文件2\Google\Chrome\Application\chrome.exe"
self.driver = webdriver.Chrome(r"D:\文件\软件\chromedriver_win32\chromedriver.exe", options=options)

def parse_data(self):time.sleep(1)room_list = self.driver.find_elements_by_xpath("/html/body/div[2]/div/div/div[4]/ul/li")print(len(room_list))temp_list = []for room in room_list:temp = {}temp["title"] = room.find_element_by_xpath("./a[2]").texttemp["url"] = room.find_element_by_xpath("./a[2]").get_attribute("href")temp["owner"] = room.find_element_by_xpath("./span[1]/span[1]/i").texttemp["type"] = room.find_element_by_xpath("./span[1]/span[2]/a").texttemp["num"] = room.find_element_by_xpath("./span[1]/span[3]/i[2]").texttemp_list.append(temp)return temp_listdef save_data(self, temp_list):for temp in temp_list:print(temp)def run(self):self.driver.get(self.url)while True:temp_list = self.parse_data()self.save_data(temp_list)try:el_next = self.driver.find_element_by_xpath("//a[@class='laypage_next']")self.driver.execute_script("scrollTo(0, 100000)")el_next.click()except:print("结束!")break

if name == ‘main’:
huya = HuYa()
huya.run()

python爬虫,虎牙房间爬取(selenium)相关推荐

  1. Python爬虫学习之爬取淘宝搜索图片

    Python爬虫学习之爬取淘宝搜索图片 准备工作 因为淘宝的反爬机制导致Scrapy不能使用,所以我这里是使用selenium来获取网页信息,并且通过lxml框架来提取信息. selenium.lxm ...

  2. python 爬虫实例 电影-Python爬虫教程-17-ajax爬取实例(豆瓣电影)

    Python爬虫教程-17-ajax爬取实例(豆瓣电影) ajax: 简单的说,就是一段js代码,通过这段代码,可以让页面发送异步的请求,或者向服务器发送一个东西,即和服务器进行交互 对于ajax: ...

  3. Python爬虫系列之爬取微信公众号新闻数据

    Python爬虫系列之爬取微信公众号新闻数据 小程序爬虫接单.app爬虫接单.网页爬虫接单.接口定制.网站开发.小程序开发 > 点击这里联系我们 < 微信请扫描下方二维码 代码仅供学习交流 ...

  4. 携程ajax,Python爬虫实战之爬取携程评论

    一.分析数据源 这里的数据源是指html网页?还是Aajx异步.对于爬虫初学者来说,可能不知道怎么判断,这里辰哥也手把手过一遍. 提示:以下操作均不需要登录(当然登录也可以) 咱们先在浏览器里面搜索携 ...

  5. Python爬虫学习笔记 -- 爬取糗事百科

    Python爬虫学习笔记 -- 爬取糗事百科 代码存放地址: https://github.com/xyls2011/python/tree/master/qiushibaike 爬取网址:https ...

  6. Python爬虫系列之爬取某奢侈品小程序店铺商品数据

    Python爬虫系列之爬取某奢侈品小程序店铺商品数据 小程序爬虫接单.app爬虫接单.网页爬虫接单.接口定制.网站开发.小程序开发> 点击这里联系我们 < 微信请扫描下方二维码 代码仅供学 ...

  7. Python爬虫 scrapy框架爬取某招聘网存入mongodb解析

    这篇文章主要介绍了Python爬虫 scrapy框架爬取某招聘网存入mongodb解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 创建项目 sc ...

  8. Python爬虫入门(爬取豆瓣电影信息小结)

    Python爬虫入门(爬取豆瓣电影信息小结) 1.爬虫概念 网络爬虫,是一种按照一定规则,自动抓取互联网信息的程序或脚本.爬虫的本质是模拟浏览器打开网页,获取网页中我们想要的那部分数据. 2.基本流程 ...

  9. Python爬虫---影评的爬取

    Python爬虫-影评的爬取 介绍:爬虫练手,使用Requests库进行豆瓣影评的爬虫,做成词云图,写文章主要做一些问题解决的记录. 运行环境:python 3.8, Pycharm 关于在豆瓣爬取影 ...

  10. 【Python爬虫】从零开始爬取Sci-Hub上的论文(串行爬取)

    [Python爬虫]从零开始爬取Sci-Hub上的论文(串行爬取) 维护日志 项目简介 步骤与实践 STEP1 获取目标内容的列表 STEP2 利用开发者工具进行网页调研 2.1 提取文章链接和分页链 ...

最新文章

  1. Scrapy框架----pipeline---------数据保存EXCEL
  2. 大学计算机基础实训excel,大学计算机基础实训指导书
  3. 跋山涉水——深入 Redis 字典遍历
  4. LintCode,hihoCoder,LeetCode有什么区别?
  5. 157. PHP 闭标签
  6. 矩阵键盘的原理及应用
  7. 分享5个Excel实用日常小技巧,不会的别说你会Excel!
  8. androidx中app.startup组件官方指南
  9. 关于word中的DDE如何查看
  10. 【YOLOV5-5.x 源码解读】plots.py
  11. 棋盘覆盖问题与可视化代码演示
  12. 【Camera】Camera中光圈、快门、感光度
  13. 个人理财--知识点总结
  14. 蒲公英 · JELLY技术周刊 Vol.11 Lighthouse 测试报告生成
  15. eclipse安装c语言开发linux,在linux下安装eclipse 开发c语言程序
  16. 足球大数据分析大小球的技巧与实例附软件
  17. Centos7 安装RVM
  18. 全国大学生数学建模竞赛2012A题葡萄酒的评价MATLAB程序
  19. CentOS 安装Httpie
  20. APP第11篇 微信小程序测试

热门文章

  1. 随机森林(RFC)实现模型优化与特征提取
  2. Content-Type四种常见取值application/x-www-form-urlencoded,multipart/form-data,application/json,text/xml
  3. 妙用switch 计算几天是 一年的第几天
  4. XrayR对接Trojan使用nginx回落笔记
  5. Part1 コンビニエンス・ストア編(1)---基本的な業務を知る
  6. Android 热修复方案分析
  7. 边缘计算网关是什么?有什么功能和特点?
  8. Python - 装机系列41 腾讯云轻服务器
  9. 阿里云Apsara Clouder专项技能认证:实现调用API接口(学习笔记及证书)
  10. 360浏览器无法打开Internet选项