循环爬取图片_Python爬虫爬取小姐姐照片!
哔哩哔哩上有一个相簿板块,里面有很多绘画和摄影,自己动手一张一张保存太慢,于是想到了python爬虫。
今天就用python来写个爬虫,爬取每月月榜上的小姐姐,一劳永逸。
爬虫步骤:
1.在bilibili上找到API接口
2.使用requests去访问接口,获取json字典
3.根据json内容,获取地址来下载图片
1.先定义请求头,模仿浏览器去访问网站;
2.定义函数获取json
3.定义下载器
4.通过循环爬取json的图片地址下载图片
效果图:
s私信小编01 获取此项目数十套PDF!
具体代码如下:
import requests
import os #定义请求头
headers={'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:69.0) Gecko/20100101 Firefox/69.0'}
def get_json(url):#定义api中的关键字params={'biz':'2','category':'cos','rank_type':'month','date':'2019-09',#修改日期可获得不同月榜'page_num':'0','page_size':'50'}#访问逻辑,处理异常try:html=requests.get(url,params=params,headers=headers)return html.json()#print(html.json())except:print('请求出错...')
def downloader(url,path):#初始化大小size=0#下载视频response=requests.get(url,headers=headers,stream=True)#构造下载器chunk_size=1024#文件大小content_size=pic[a]['img_size']print('[图片大小]:%0.2f MB'%(content_size/chunk_size))#文件处理if response.status_code==200:with open(path,'wb') as f:#迭代相应数据for data in response.iter_content(chunk_size=chunk_size):f.write(data)size+=len(data)
if __name__=="__main__":try:os.mkdir('./图片')except:passfor i in range(10):url='https://api.vc.bilibili.com/link_draw/v2/Doc/ranklist?'html=get_json(url)infos=html['data']['items']for info in infos:a=0pic=info['item']['pictures']title=info['item']['title']try:a+=ipic_url=pic[a]['img_src'] path='./图片/%s.jpg' % (title+str(a))downloader(pic_url,path)print(path)print('下载成功') except:print('下载失败...')
循环爬取图片_Python爬虫爬取小姐姐照片!相关推荐
- python怎么批量爬取图片_python批量爬取网络图片
上篇通过python爬取了一篇网络小说,初步了解了爬虫的四步流程,本文稍微扩展一点,试着从网页中爬取出多个图片,具体来看看: 我们今天试着从下面图1的网页上将所有图片都爬取出来,放在一个指定的文件夹里 ...
- python爬取图片_python批量爬取网络图片
上篇通过python爬取了一篇网络小说,初步了解了爬虫的四步流程,本文稍微扩展一点,试着从网页中爬取出多个图片,具体来看看: 我们今天试着从下面图1的网页上将所有图片都爬取出来,放在一个指定的文件夹里 ...
- python网络爬图_Python爬虫爬图片需要什么
Python爬虫爬图片需要什么?下面用两种方法制作批量爬取网络图片的方法: 第一种方法:基于urllib实现 要点如下: 1.url_request = request.Request(url) 2. ...
- python爬歌词_python爬虫抓取某易云音乐歌词,从此不在下载
本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理 以下文章来源于腾讯云 作者:企鹅号小编 ( 想要学习Python?Python学习 ...
- python爬虫爬汽车图片_python爬虫爬取汽车网站外型图片
我选择的起始网址:http://www.hao123.com/auto/brand 当你随便选择一个车牌的选框( 不要 同时选择多个选框)你就会发现每个车牌对应一个网址 每个网址的区别就是数字不同 比 ...
- python怎么爬虎牙_Python爬虫爬取虎牙数据!谁才是虎牙第一主播!
首先打开我们所需要爬取的网站,这里我们挑选的是虎牙直播. 我们今天所爬取的数据就是直播名,直播地址,直播的人,观看数以及直播的类别,如下图所示 第一步关于直播的类别,从第一张图片我们可以看到在右边有直 ...
- Python爬虫 | 爬取高质量小姐姐照片
Python爬虫 | 爬取高质量小姐姐照片 1.数据来源分析 2.获取author_id_list和img_id 3.制作detial 4.制作detial_list 5.数据保存 6.批量获取 7. ...
- Python爬取小姐姐图片
使用Python爬取小姐姐图片 首先上网站链接 唯美女生 爬取图片主要分为一下几步: 1.打开一个你喜欢的小姐姐的网站 E.g xiaojiejie web 2.下载并安装python环境 pytho ...
- 我花 1 分钟写了一段爬虫,帮助小姐姐解放了双手
1. 场景 最近有一位小姐姐向我抱怨,说她家宝宝最近要打预防针,受疫情影响,市区定点的社康医院太少,导致预约号基本靠抢,根本是一号难求 每次预约都要一直守在手机旁,不停地刷新页面去抢号,太耽误功夫了, ...
最新文章
- UVA 11054 Wine trading in Gergovia 葡萄酒交易 贪心+模拟
- Kotlin数组(Array)
- 【django】站点管理
- Qt的index 用方法static_castCTableItem*(index.internalPointer())取出来的值的成员都未初始化...
- Js数据类型之——Date
- php调用含有命名空间的类
- 解决方案:重复抢单(Redis原子计数器incr)
- numpy random 模块
- 嵌入式电路设计(符号库和封装库)
- 20165230 2017-2018-2 《Java程序设计》第8周学习总结
- 微信小程序测试二维码跳转链接
- vmware虚拟机连接服务器超时,vmware连接远程服务器超时
- 漫话:希尔排序,这篇还看不懂麻烦找我拿红包
- 1.操作系统的基本特性和主要功能
- 支付系统中如何应用加密方式的
- Linux开放端口号
- Android Instant Apps
- 帝国cms如何导入php模板,帝国CMS模板组导入导出更换模板
- 《认知红利》读书总结+思考
- 7-6 厘米换算英尺英寸
热门文章
- ThickBox学习之一 ThickBox介绍以及单图片显示示例
- 别人推荐的一首好听的歌
- Intellij idea 设置关闭自动更新
- Android9.0 setStereoVolume左右声道流程(二十四)
- 单、双链表的循环链表(十五)
- cmake之TEST与TEST_F用法(五)
- tcpdump抓包+wireshark分析配合使用(二)
- C#之Bcd码时间转成ToDateTime
- VALSE学习(十八):复杂视频的深度高效分析与理解方法
- Educoder 机器学习 SMO进行优化 第1关:SMO高效优化算法