爬取防盗链图片

import urllib.request
from lxml import etree
import time
import osheaders = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.77 Safari/537.36',#防盗链图片必须填写首页地址信息'Referer': 'http://www.mmjpg.com/',}
#随机名字函数
def random_string(length=5):import randombase_dir = 'zxcvbnmasdfghjkqwertyuio123456789'return ''.join(random.choice(base_dir) for i in range(length))
def parse_img(img,page):tree = etree.HTML(img)img_urls = tree.xpath('//div[@class="main"]/div[@class="pic"]/ul/li/a/img/@src')for url in img_urls:print("开始爬取...")# 构建请求对象request = urllib.request.Request(url=url, headers=headers)#发送请求,得到响应response = urllib.request.urlopen(request)#图片名image_name = random_string()#拼接文件名,图片名+后缀filename = image_name + '.' + url.split('.')[-1]#存入文件夹路径dirname = 'meitu'#拼接路径path = os.path.join(dirname, filename)#写入with open(path, 'wb') as fp:fp.write(response.read())print("结束爬取",filename)#停留2秒,过快可能导致封IPtime.sleep(2)time.sleep(1)
#构建请求对象
def handle_request(url,page):url= url.format(page)request = urllib.request.Request(url=url,headers=headers)return request
#主函数
def main():start_page = int(input("起始页输入2"))end_page = int(input('结束页,每页15张图片,目前不知有多少页'))#换页路径url = 'http://www.mmjpg.com/home/{}'for page in range(start_page,end_page+1):request = handle_request(url,page)img = urllib.request.urlopen(request).read()img_urls = parse_img(img,page)if __name__ == '__main__':main()

爬取防盗链图片福利你懂得相关推荐

  1. python爬取妹纸图片

    初学python,刚好看到爬取妹纸图片的教学视频,于是跟着学习学习python网络爬虫,使用python爬取图片. 进入主页,可以看到妹子自拍,一共446页之多 0.0 ,如下图所示: 查看网页url ...

  2. lofter 爬虫_Python网络爬虫1 - 爬取网易LOFTER图片

    LOFTER是网易出品的优质轻博客,灵感源于国外的tumblr,但比之更加文艺,更加本地化.本人非常喜欢LOFTER的UI设计,以及其中的优质用户和内容,似乎网易并不擅长推广,所以受众并不广泛.这都是 ...

  3. 手把手带你爬取百度美女图片,Python练手项目!

    本文纯技术角度出发,教你如何用Python爬虫获取百度美女图片--技术无罪. 目标站点 百度图片使用关键字搜索 小姐姐私房照 https://image.baidu.com/ 开发环境 系统:Wind ...

  4. Python爬虫入门——爬取贴吧图片

    最近忽然想听一首老歌,"I believe" 于是到网上去搜,把几乎所有的版本的MV都看了一遍(也是够无聊的),最喜欢的还是最初版的<我的野蛮女友>电影主题曲的哪个版本 ...

  5. node.js抓取网络图片保存到本地,node.js抓取防盗链网络图片保存到本地

    node.js抓取网络图片保存到本地,node.js抓取防盗链网络图片保存到本地 使用模块request.fs,request模块在npm里平均月下载量超过3000W次,那是相当的牛逼. node版本 ...

  6. python爬取图片教程-推荐|Python 爬虫系列教程一爬取批量百度图片

    Python 爬虫系列教程一爬取批量百度图片https://blog.csdn.net/qq_40774175/article/details/81273198# -*- coding: utf-8 ...

  7. python爬取京东手机数据_实例解析Python如何实现爬取京东手机图片

    本文主要为大家分享一篇Python如何实现爬取京东手机图片的方法,具有很好的参考价值,希望对大家有所帮助.一起跟随小编过来看看吧,希望能帮助到大家. 运行环境Python3.6.4#爬取京东手机图片i ...

  8. 使用Python爬虫爬取网络美女图片

    代码地址如下: http://www.demodashi.com/demo/13500.html 准备工作 安装python3.6 略 安装requests库(用于请求静态页面) pip instal ...

  9. python爬取贴吧图片_Python爬取贴吧多页图片

    Python爬取贴吧图片都只能爬取第一页的,加了循环也不行,现在可以了. #coding:utf-8 import urllib import urllib2 import re import os ...

最新文章

  1. 设置div中的div居中显示
  2. vue 数据更新不及时_陈词懒调的《未来天王》正式完结,再也不用担心她更新不及时了!...
  3. 实现人脸识别“干货”
  4. 分布式存储系统设计的几个问题和考虑点
  5. mysql 值到99999后不增值了_Mysql 增加新数据,若存在则更新的问题
  6. imx6q 开发板_mplayer移植-迅为IMX6Q开发板
  7. 开源、免费、企业级的SiteServer CMS .NET CORE 7.0 预览版发布
  8. 第九篇:Spring Boot整合Spring Data JPA_入门试炼05
  9. lazarus控件怎么那么少_盘点5个常被搞混的控件与规范
  10. 鼠标移动 改变Datagrid行的背景颜色
  11. 华为机试HJ30:字符串合并处理
  12. Nginx 场景应用
  13. saltstack之nginx、php的配置
  14. K个排序链表的合并(Hard)
  15. 数论基础——素数判断约数枚举整数分解(模板)
  16. windows域环境搭建上
  17. 仿迅雷播放器教程 -- 提取exe资源
  18. 【LaTeX入门】15 在文章中添加脚注
  19. Unity手游实战:从0开始SLG——本地化篇(一)聊聊游戏本地化
  20. 三年级计算机课标,三年级信息技术教案上册

热门文章

  1. 什么是长连接、短连接
  2. windows上在python玩耍深度学习资源合集
  3. 01-Httprunner接口自动化第一篇:应用环境与安装
  4. pcd点云地图转换为八叉树ot地图
  5. 卧底肯德基和麦当劳的企业微信群后,我发现了社群的新玩法!
  6. linux服务器使用手册
  7. 联想计算机M.2固态银盘,联想天逸510s 08IKL更换M.2 PCIE 固态硬盘后装系统,亲测有效...
  8. 跟软件专家学沟通技巧(二)
  9. cad中简单流程图制作_1600字解读装修施工流程,看完你就入门了!(流程图制作中)...
  10. 为docker容器设置独立ip