#coding:utf-8
#下载斗鱼主播图片
from selenium import webdriver
from selenium.webdriver.chrome.options import Options
from lxml import etree
import requests
import time#设置使用chrome headless
chrome_options = Options()
chrome_options.add_argument('--headless')
chrome_options.add_argument('--disable-gpu')
chrome_options.binary_location = r'C:\Program Files (x86)\Google\Chrome\Application\chrome.exe'
driver = webdriver.Chrome(chrome_options=chrome_options)
#进入网站
driver.get("https://www.douyu.com/directory/game/yz")ua_headers={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 Safari/537.36'}def writePicture(picUrl,name):''':param picUrl: 图片的url:param name:   主播昵称,作为图片名称'''r=requests.get(picUrl,headers=ua_headers)with open('douyu/' + name + ".jpg", 'wb') as f:f.write(r.content)def downloadPic():#获取一个主播信息集合,每块标签内标注一个主播的信息host=driver.find_elements_by_class_name('play-list-link')for beauty in host:#得到单个主播信息的实际html内容data=beauty.get_attribute('innerHTML')#lxml解析html=etree.HTML(data)#获取主播昵称btName=html.xpath("//span[@class='dy-name ellipsis fl']")[0].text#获取主播头像路径btPic=html.xpath("//img[@class='JS_listthumb']/@data-original")[0]#记录图片writePicture(btPic,btName)def scanHtml():downloadPic()# 下一页driver.find_elements_by_class_name('shark-pager-next')[0].click()if __name__=='__main__':while True:#标记下一页是否为灰色,如果为灰色,flag为1,否则为-1flag=driver.page_source.find("shark-pager-next shark-pager-disable shark-pager-disable-next")if flag==-1:scanHtml()#等待下载图片time.sleep(3)else:scanHtml()break

结果:

python3 selenium xpath 下载斗鱼颜值主播头像 入门demo相关推荐

  1. 爬取斗鱼LOL主播人气数据,并显示排行榜 [网络爬虫] [应用案例][请求头][模块]

    您的"关注"和"点赞",是信任,是认可,是支持,是动力- 如意见相佐,可留言. 本人必将竭尽全力试图做到准确和全面,终其一生进行修改补充更新. 文章目录 1 爬 ...

  2. java io 视频 下载_Java下载映客主播视频回放到电脑硬盘

    Java下载映客主播视频回放到电脑硬盘 使用Java下载映客回放到电脑硬盘 使用方法:在映客app播放回放视频时,分享到QQ,就可以得到url,其中的liveid属性就是视频ID. 源代码由 [**海 ...

  3. 网易云音乐电脑版怎么下载电台节目 主播电台节目下载教程

    网易云音乐不仅可以听歌,还可以在主播电台中,听到各类主播的声音,下面我们就来讲讲网易云音乐电脑版怎么下载电台节目,一起来看教程吧! 网易云音乐电脑版怎么下载电台节目 主播电台节目下载教程 网易云音乐P ...

  4. 斗鱼美女主播封面爬取 python request urlretrieve jsonpath 爬虫

    斗鱼美女主播封面爬取 python request urlretrieve jsonpath 爬虫 输出结果 

  5. Qt网络编程-简易版UDP组播通信入门Demo(5)

    Qt网络编程-简易版UDP组播通信入门Demo(5)

  6. Python爬虫:爬取某鱼颜值主播MM图片,你的最爱!?

    一.准备 1.创建scrapy项目 scrapy startproject douyu cd douyu scrapy genspider spider "www.douyu.com&quo ...

  7. Python爬虫:爬取某鱼颜值主播图片并保存到本地升级版!

    一.准备 1.创建scrapy项目 scrapy startproject douyucd douyuscrapy genspider spider "www.douyu.com" ...

  8. 今日头条收购锤子?ofo 半月退 24 万户押金;斗鱼索赔主播 1.5 亿元 | 极客头条...

    「CSDN 极客头条」,是从 CSDN 网站延伸至官方微信公众号的特别栏目,专注于一天业界事报道.风里雨里,我们将每天为朋友们,播报最新鲜有料的新闻资讯,让所有技术人,时刻紧跟业界潮流. 快讯速知 今 ...

  9. 直播画面已被主播锁定!输入正确的密码后可解锁画面。斗鱼直播主播锁定画面解锁方法(网页版)

    解决斗鱼网页版:直播画面已被主播锁定,输入正确的密码后可解锁画面 的问题 注意:此博客仅供技术交流参考,擅自操作造成的一切法律责任自负!!! 问题描述 问题分析 解决思路 具体方法 1.网页空白处点击 ...

  10. 爬虫虎牙斗鱼网站主播人气和姓名

    虎牙 from urllib import request import reclass Pachong():# 虎牙url ='https://www.huya.com/g/2168'root =' ...

最新文章

  1. 测试回收站测试回收站2测试回收站2测试回收站2测试回收站2测试回收站2测试回收站2测试回收站2测试回收站2测试回收站2测试回收站2测试回收站2测试回收站2测试回收站2测试回收站2测试回收站2测试回收站
  2. IDEA 查看本地历史版本
  3. 保研面试 算法题_面试挂在了一道 LRU 缓存算法设计题
  4. 解决unity 打包在Android 8.0上启动出现黑屏问题(Android权限弹窗问题)
  5. C++ I/O库练习
  6. 基于胜任力模型的项目经理岗位培训需求分析研究
  7. JS web localStorage传值 coolie传值
  8. 在Word中自定义多级列表样式
  9. directadmin php5.6,directadmin教程
  10. 倒数闩锁CountDownLatch源码浅析
  11. MySQL比较两张表数据相同、不同结果记录
  12. LWN:5.17 合并窗口第一部分!
  13. 通过NTC电阻测电机温度
  14. 微软与华盛顿大学合作研发DNA存储技术
  15. docker容器启动失败:Error response from daemon: Container xxx is not running
  16. E. Add Modulo 10(规律)
  17. Generalized-ICP(GICP)論文研讀
  18. 什么是DNS劫持?如何进行有效应对?
  19. 虚拟机不能识别本地镜像
  20. python-电信宽带提速器软件

热门文章

  1. 一般试卷的纸张大小是多少_试卷字体多大合适 标准试卷的字体大小
  2. OSPF学习笔记整理
  3. 系统语言在C盘什么地方,Win7桌面文件在C盘哪里?|Win7系统桌面文件在哪?
  4. GAMIT/GLOBK入门简介和安装
  5. 最新电脑cpu性能排行服务器,至强cpu天梯图2020_intel服务器cpu排行榜2020
  6. 2019 d serv 激活_Science | 清华大学柴继杰课题组与合作者首次揭示植物TNL类抗病蛋白激活的分子机制...
  7. 算法的时间复杂度和空间复杂度-总结
  8. 异数OS 织梦师-纤手(二)-- LPC RPC篇
  9. Go 编程语言官方文档中文版和官方教程中文版
  10. ISE14.7固化程序(生成.mcs文件再固化)