爬取某直播网站首页小姐姐的照骗
#使用正则表达式取出网页中图片url并下载图片
import time
import re
import requests
import multiprocessing
import osdef down_image(url,i):data = requests.get(url).contentprint("正在下载第%d张图片...%s"%(i,url))name = url[-15:] if not os.path.exists("./douyu"):os.mkdir("./douyu")with open("./douyu/" + name,"wb") as f:f.write(data)def dealdata(html):exp = r'https?://[^:]*_big\.jpg'ls = re.findall(exp,html)i = 1print("共找到%d张符合要求的图片,开始下载..."%len(ls))begin = time.time()pool = multiprocessing.Pool(10)for url in ls:pool.apply_async(down_image, args = (url,i))i += 1pool.close()pool.join()end = time.time()print("下载完成共耗时%f秒"%(end-begin))def main():pagenum = int(input("请输入要下载的页码:"))url = "https://www.douyu.com/gapi/rkc/directory/2_201/%d"%pagenumheaders = {"User-Agent":"Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_5) AppleWebKit/537.36 (KHTML, like Gecko)"}html = requests.get(url, headers = headers).textdealdata(html)if __name__ == "__main__":main()
爬取某直播网站首页小姐姐的照骗相关推荐
- Python爬虫利用18行代码爬取虎牙上百张小姐姐图片
Python爬虫利用18行代码爬取虎牙上百张小姐姐图片 下面开始上代码 需要用到的库 import request #页面请求 import time #用于时间延迟 import re #正则表达式 ...
- [ Python ] 爬虫类库学习之 xpath,爬取彼岸图网的 小姐姐 图片
安装:pip install lxml 实例化一个etree对象 from lxml import etree 1.将本地的html文档中的源码数据加载到etree对象中 etree.parse(fi ...
- Python爬取斗鱼直播网站信息
一.需求 爬取斗鱼直播网站信息,如直播名字.主播名字.热度.图片和房间网址,将这些数据保存到csv文件中,并单独创建文件夹保存图片. 斗鱼直播网址:https://www.douyu.com/g_LO ...
- Python网络爬虫实战:世纪佳缘爬取近6万条小姐姐数据后发现惊天秘密
翻着安静到死寂的聊天列表,我忽然惊醒,不行,我们不能这样下去,光羡慕别人有什么用,我们要行动起来,去找自己的幸福!!! 我也想"谈不分手的恋爱" !!!内牛满面!!! 注册登陆一气 ...
- denied 登陆后access_Python网络爬虫实战:世纪佳缘爬取近6万条小姐姐数据后发现惊天秘密...
翻着安静到死寂的聊天列表,我忽然惊醒,不行,我们不能这样下去,光羡慕别人有什么用,我们要行动起来,去找自己的幸福!!! 我也想"谈不分手的恋爱" !!!内牛满面!!! 注册登陆一气 ...
- Python爬虫实战:世纪佳缘爬取近6万条小姐姐数据!脱单的有望!
马上又是一年双十一了,不知道从什么时候开始,双十一从"光棍节"变成了"双十一购物狂欢节",最后一个属于单身狗的节日也成功被攻陷,成为了情侣们送礼物秀恩爱的节日. ...
- 【Python】多线程爬取某站高颜值小姐姐照片(共1.62GB)
文章目录 写在前面 目标网站 依赖模块 爬虫思路 完整代码 爬虫结果 单图预览 多图预览 引用参考 写在前面 本文使用Python编写爬虫脚本,实现多线程爬取唯美女生网站高颜值小姐姐的所有照片. 目标 ...
- python爬取无水印抖音小姐姐视频(2018最新,含Pyqt客户端)
各位小伙伴,之前一段时间迷上了抖音小姐姐视频,但是下载的视频都有水印,于是自己用Python 写了个爬取小姐姐视频的工具,大家可以直接拷贝到自己编译器上运行.此外,我还利用pyqt5写了个操作界面,这 ...
- 爬取某网几千张小姐姐私房照,准备好纸,别流鼻血,速速收藏
效果: 什么?看不清? 准备发车 模块下载: pip install requests pip install re 第一部分:定义要爬取的标签和正在爬取的页数 def UserUrl(theme,p ...
最新文章
- 从LINQ开始之LINQ to Objects(下)
- 常用开源Jabber服务器介绍
- 快速下载Spring官网下载dist.zip中所有jar,例如spring-5.2.10.RELEASE-dist.zip
- 一句话讲清楚IOC容器以及什么时候使用@Autowired
- sql练习(针对Mysql)
- 前端插件——Bootstrap Dual Listbox 简介
- linux系统无法读取硬盘,安装CentOS时读取硬盘错误解决办法
- javabean 是什么?
- 算法设计与分析(第四版)第一章课后答案
- sybase常用sql语句
- [NOIP2016 提高组] 玩具谜题
- mac mysql dmg_在mac下使用DMG安装Mysql
- 北大方正集团名列2018年中国电子信息百强第8位
- mysql 全文索引 使用_MySql全文索引
- 塞尔达传说修改器html,塞尔达传说荒野之息内存修改器修改服装教程
- c语言桌面程序 touch unity,[Unity移动端]Touch类
- Vue中根据输入的身份证号识别年龄、性别
- 用Eclipse读取excel中全部数据
- SSD固态硬盘特性术语bit位设置
- 超级巡警,专杀各类病毒木马