爬取防盗链图片福利你懂得
爬取防盗链图片
import urllib.request
from lxml import etree
import time
import osheaders = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.77 Safari/537.36',#防盗链图片必须填写首页地址信息'Referer': 'http://www.mmjpg.com/',}
#随机名字函数
def random_string(length=5):import randombase_dir = 'zxcvbnmasdfghjkqwertyuio123456789'return ''.join(random.choice(base_dir) for i in range(length))
def parse_img(img,page):tree = etree.HTML(img)img_urls = tree.xpath('//div[@class="main"]/div[@class="pic"]/ul/li/a/img/@src')for url in img_urls:print("开始爬取...")# 构建请求对象request = urllib.request.Request(url=url, headers=headers)#发送请求,得到响应response = urllib.request.urlopen(request)#图片名image_name = random_string()#拼接文件名,图片名+后缀filename = image_name + '.' + url.split('.')[-1]#存入文件夹路径dirname = 'meitu'#拼接路径path = os.path.join(dirname, filename)#写入with open(path, 'wb') as fp:fp.write(response.read())print("结束爬取",filename)#停留2秒,过快可能导致封IPtime.sleep(2)time.sleep(1)
#构建请求对象
def handle_request(url,page):url= url.format(page)request = urllib.request.Request(url=url,headers=headers)return request
#主函数
def main():start_page = int(input("起始页输入2"))end_page = int(input('结束页,每页15张图片,目前不知有多少页'))#换页路径url = 'http://www.mmjpg.com/home/{}'for page in range(start_page,end_page+1):request = handle_request(url,page)img = urllib.request.urlopen(request).read()img_urls = parse_img(img,page)if __name__ == '__main__':main()
爬取防盗链图片福利你懂得相关推荐
- python爬取妹纸图片
初学python,刚好看到爬取妹纸图片的教学视频,于是跟着学习学习python网络爬虫,使用python爬取图片. 进入主页,可以看到妹子自拍,一共446页之多 0.0 ,如下图所示: 查看网页url ...
- lofter 爬虫_Python网络爬虫1 - 爬取网易LOFTER图片
LOFTER是网易出品的优质轻博客,灵感源于国外的tumblr,但比之更加文艺,更加本地化.本人非常喜欢LOFTER的UI设计,以及其中的优质用户和内容,似乎网易并不擅长推广,所以受众并不广泛.这都是 ...
- 手把手带你爬取百度美女图片,Python练手项目!
本文纯技术角度出发,教你如何用Python爬虫获取百度美女图片--技术无罪. 目标站点 百度图片使用关键字搜索 小姐姐私房照 https://image.baidu.com/ 开发环境 系统:Wind ...
- Python爬虫入门——爬取贴吧图片
最近忽然想听一首老歌,"I believe" 于是到网上去搜,把几乎所有的版本的MV都看了一遍(也是够无聊的),最喜欢的还是最初版的<我的野蛮女友>电影主题曲的哪个版本 ...
- node.js抓取网络图片保存到本地,node.js抓取防盗链网络图片保存到本地
node.js抓取网络图片保存到本地,node.js抓取防盗链网络图片保存到本地 使用模块request.fs,request模块在npm里平均月下载量超过3000W次,那是相当的牛逼. node版本 ...
- python爬取图片教程-推荐|Python 爬虫系列教程一爬取批量百度图片
Python 爬虫系列教程一爬取批量百度图片https://blog.csdn.net/qq_40774175/article/details/81273198# -*- coding: utf-8 ...
- python爬取京东手机数据_实例解析Python如何实现爬取京东手机图片
本文主要为大家分享一篇Python如何实现爬取京东手机图片的方法,具有很好的参考价值,希望对大家有所帮助.一起跟随小编过来看看吧,希望能帮助到大家. 运行环境Python3.6.4#爬取京东手机图片i ...
- 使用Python爬虫爬取网络美女图片
代码地址如下: http://www.demodashi.com/demo/13500.html 准备工作 安装python3.6 略 安装requests库(用于请求静态页面) pip instal ...
- python爬取贴吧图片_Python爬取贴吧多页图片
Python爬取贴吧图片都只能爬取第一页的,加了循环也不行,现在可以了. #coding:utf-8 import urllib import urllib2 import re import os ...
最新文章
- 设置div中的div居中显示
- vue 数据更新不及时_陈词懒调的《未来天王》正式完结,再也不用担心她更新不及时了!...
- 实现人脸识别“干货”
- 分布式存储系统设计的几个问题和考虑点
- mysql 值到99999后不增值了_Mysql 增加新数据,若存在则更新的问题
- imx6q 开发板_mplayer移植-迅为IMX6Q开发板
- 开源、免费、企业级的SiteServer CMS .NET CORE 7.0 预览版发布
- 第九篇:Spring Boot整合Spring Data JPA_入门试炼05
- lazarus控件怎么那么少_盘点5个常被搞混的控件与规范
- 鼠标移动 改变Datagrid行的背景颜色
- 华为机试HJ30:字符串合并处理
- Nginx 场景应用
- saltstack之nginx、php的配置
- K个排序链表的合并(Hard)
- 数论基础——素数判断约数枚举整数分解(模板)
- windows域环境搭建上
- 仿迅雷播放器教程 -- 提取exe资源
- 【LaTeX入门】15 在文章中添加脚注
- Unity手游实战:从0开始SLG——本地化篇(一)聊聊游戏本地化
- 三年级计算机课标,三年级信息技术教案上册
热门文章
- 什么是长连接、短连接
- windows上在python玩耍深度学习资源合集
- 01-Httprunner接口自动化第一篇:应用环境与安装
- pcd点云地图转换为八叉树ot地图
- 卧底肯德基和麦当劳的企业微信群后,我发现了社群的新玩法!
- linux服务器使用手册
- 联想计算机M.2固态银盘,联想天逸510s 08IKL更换M.2 PCIE 固态硬盘后装系统,亲测有效...
- 跟软件专家学沟通技巧(二)
- cad中简单流程图制作_1600字解读装修施工流程,看完你就入门了!(流程图制作中)...
- 为docker容器设置独立ip