#使用正则表达式取出网页中图片url并下载图片
import time
import re
import requests
import multiprocessing
import osdef down_image(url,i):data = requests.get(url).contentprint("正在下载第%d张图片...%s"%(i,url))name = url[-15:] if not os.path.exists("./douyu"):os.mkdir("./douyu")with open("./douyu/" + name,"wb") as f:f.write(data)def dealdata(html):exp = r'https?://[^:]*_big\.jpg'ls = re.findall(exp,html)i = 1print("共找到%d张符合要求的图片,开始下载..."%len(ls))begin = time.time()pool = multiprocessing.Pool(10)for url in ls:pool.apply_async(down_image, args = (url,i))i += 1pool.close()pool.join()end = time.time()print("下载完成共耗时%f秒"%(end-begin))def main():pagenum = int(input("请输入要下载的页码:"))url = "https://www.douyu.com/gapi/rkc/directory/2_201/%d"%pagenumheaders = {"User-Agent":"Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_5) AppleWebKit/537.36 (KHTML, like Gecko)"}html = requests.get(url, headers = headers).textdealdata(html)if __name__ == "__main__":main()

爬取某直播网站首页小姐姐的照骗相关推荐

  1. Python爬虫利用18行代码爬取虎牙上百张小姐姐图片

    Python爬虫利用18行代码爬取虎牙上百张小姐姐图片 下面开始上代码 需要用到的库 import request #页面请求 import time #用于时间延迟 import re #正则表达式 ...

  2. [ Python ] 爬虫类库学习之 xpath,爬取彼岸图网的 小姐姐 图片

    安装:pip install lxml 实例化一个etree对象 from lxml import etree 1.将本地的html文档中的源码数据加载到etree对象中 etree.parse(fi ...

  3. Python爬取斗鱼直播网站信息

    一.需求 爬取斗鱼直播网站信息,如直播名字.主播名字.热度.图片和房间网址,将这些数据保存到csv文件中,并单独创建文件夹保存图片. 斗鱼直播网址:https://www.douyu.com/g_LO ...

  4. Python网络爬虫实战:世纪佳缘爬取近6万条小姐姐数据后发现惊天秘密

    翻着安静到死寂的聊天列表,我忽然惊醒,不行,我们不能这样下去,光羡慕别人有什么用,我们要行动起来,去找自己的幸福!!! 我也想"谈不分手的恋爱" !!!内牛满面!!! 注册登陆一气 ...

  5. denied 登陆后access_Python网络爬虫实战:世纪佳缘爬取近6万条小姐姐数据后发现惊天秘密...

    翻着安静到死寂的聊天列表,我忽然惊醒,不行,我们不能这样下去,光羡慕别人有什么用,我们要行动起来,去找自己的幸福!!! 我也想"谈不分手的恋爱" !!!内牛满面!!! 注册登陆一气 ...

  6. Python爬虫实战:世纪佳缘爬取近6万条小姐姐数据!脱单的有望!

    马上又是一年双十一了,不知道从什么时候开始,双十一从"光棍节"变成了"双十一购物狂欢节",最后一个属于单身狗的节日也成功被攻陷,成为了情侣们送礼物秀恩爱的节日. ...

  7. 【Python】多线程爬取某站高颜值小姐姐照片(共1.62GB)

    文章目录 写在前面 目标网站 依赖模块 爬虫思路 完整代码 爬虫结果 单图预览 多图预览 引用参考 写在前面 本文使用Python编写爬虫脚本,实现多线程爬取唯美女生网站高颜值小姐姐的所有照片. 目标 ...

  8. python爬取无水印抖音小姐姐视频(2018最新,含Pyqt客户端)

    各位小伙伴,之前一段时间迷上了抖音小姐姐视频,但是下载的视频都有水印,于是自己用Python 写了个爬取小姐姐视频的工具,大家可以直接拷贝到自己编译器上运行.此外,我还利用pyqt5写了个操作界面,这 ...

  9. 爬取某网几千张小姐姐私房照,准备好纸,别流鼻血,速速收藏

    效果: 什么?看不清? 准备发车 模块下载: pip install requests pip install re 第一部分:定义要爬取的标签和正在爬取的页数 def UserUrl(theme,p ...

最新文章

  1. 从LINQ开始之LINQ to Objects(下)
  2. 常用开源Jabber服务器介绍
  3. 快速下载Spring官网下载dist.zip中所有jar,例如spring-5.2.10.RELEASE-dist.zip
  4. 一句话讲清楚IOC容器以及什么时候使用@Autowired
  5. sql练习(针对Mysql)
  6. 前端插件——Bootstrap Dual Listbox 简介
  7. linux系统无法读取硬盘,安装CentOS时读取硬盘错误解决办法
  8. javabean 是什么?
  9. 算法设计与分析(第四版)第一章课后答案
  10. sybase常用sql语句
  11. [NOIP2016 提高组] 玩具谜题
  12. mac mysql dmg_在mac下使用DMG安装Mysql
  13. 北大方正集团名列2018年中国电子信息百强第8位
  14. mysql 全文索引 使用_MySql全文索引
  15. 塞尔达传说修改器html,塞尔达传说荒野之息内存修改器修改服装教程
  16. c语言桌面程序 touch unity,[Unity移动端]Touch类
  17. Vue中根据输入的身份证号识别年龄、性别
  18. 用Eclipse读取excel中全部数据
  19. SSD固态硬盘特性术语bit位设置
  20. 超级巡警,专杀各类病毒木马

热门文章

  1. 四大CPU体系结构:ARM、X86/Atom、MIPS、PowerPC
  2. 基于MSP430G2231实现的频率计
  3. 原版软件工程图书阅读指南 刘艺
  4. 华为推送自定义动作配置
  5. php表单提交到数据库详解
  6. myeclipse10激活注册码生成器代码
  7. flutter混淆编译生成releaseAPK文件
  8. WPS 2007轻松插入特色页码
  9. 怎么把mp3的声音调大?
  10. 【NLP】中文平均信息熵