目标抓取全站妹子封面图片全部爬下来以图片标题命名
  1. 分析网页数据结构

    妹子图首页

  2. 接下来找张图片右击点击检查

    想要数据

  3. 拿到图片链接直接用浏览器可以访问,但是程序下载有反爬虫,图片直接下载不了需要加请求头部信息

    先上手代码试试!

import requests
from lxml import etree# 设计模式 --》面向对象编程
class Spider(object):def __init__(self):# 反反爬虫措施,加请求头部信息self.headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.110 Safari/537.36","Referer": "https://www.mzitu.com/xinggan/"}def start_request(self):# 1. 获取整体网页的数据 requestsfor i in range(1, 204):print("==========正在抓取%s页==========" % i)response = requests.get("https://www.mzitu.com/page/"+ str(i) + "/", headers=self.headers)html = etree.HTML(response.content.decode())self.xpath_data(html)def xpath_data(self, html):# 2. 抽取想要的数据 标题 图片 xpathsrc_list = html.xpath('//ul[@id="pins"]/li/a/img/@data-original')alt_list = html.xpath('//ul[@id="pins"]/li/a/img/@alt')for src, alt in zip(src_list, alt_list):file_name = alt + ".jpg"response = requests.get(src, headers=self.headers)print("正在抓取图片:" + file_name)# 3. 存储数据 jpg with opentry:with open(file_name, "wb") as f:f.write(response.content)except:print("==========文件名有误!==========")spider = Spider()
spider.start_request()

  

哎!好像没问题!

运行中

运行结果

同学们,都把裤子给我穿上!好好学习!
教程已出,但是可能有很多网友不会使用
大家有任何问题可以扫描二维码关注公众号,添加我的微信
我会第一时间为大家解答

本公众号只出精品,拒收劣质

转载于:https://www.cnblogs.com/girliswater/p/11152942.html

Python抓取妹子图,内含福利相关推荐

  1. 获取http地址如何从上面抓取图片_用 Python 自动抓取妹子图

    目录 前言 Media Pipeline 启用Media Pipeline 使用 ImgPipeline 抓取妹子图 瞎比比与送书后话 前言 我们在抓取数据的过程中,除了要抓取文本数据之外,当然也会有 ...

  2. python多线程url采集器 + github_利用Python3.5多线程抓取妹子图

    很久之前就写了这个爬妹子图的Python爬虫,并且开源到Github上,然而居然没有人给小心心,虽然现在失效了,妹子图网站开启了反爬虫机制,但还是可以作为大家学习的样例,注释也很清晰. 0x01 起因 ...

  3. 小白爬虫第一弹之抓取妹子图

    点击上方"程序员大咖",选择"置顶公众号" 关键时刻,第一时间送达! 这是一篇完全给新手写的爬虫教程 由于经常在群里装逼加上群主懒啊(你看有多久没更新文章就知道 ...

  4. Python 爬取妹子图02

    爬取laotuzi.com这个网站的图片 原本想爬的是妹子图这个网站的,结果应该是IP被封了,用电脑连接WiFi访问不了这个网站,我以为是断网了,但访问其他网站有能正常访问,用手机流量访问妹子图网站, ...

  5. 教你用Python爬取妹子图APP

    教你用Python爬美之图APP全站图片 爬取结果 程序只运行了2h,最后认为程序没有问题了就关了(我可不是去杀生去了...... 运行环境 Python 3.5+ Windows 10 VSCode ...

  6. python 爬取妹子图

    作为一个python还没入门的小白,搞懂这段代码实在是很不容易,还要去学html的知识(#黑脸) 因此我加上了注释,比较好读懂点 #coding=utf-8 import time import re ...

  7. python多线程爬取妹子图

    python多线程爬取妹子图 python使用版本: 3.7 目的: 自己选择下载目录,逐个将主题图片保存到选定目录下. 效果: 一秒钟左右下载一张图片,下了七八十组图片暂时没什么问题,不放心的话,可 ...

  8. Python 爬虫入门(二)——爬取妹子图

    Python 爬虫入门 听说你写代码没动力?本文就给你动力,爬取妹子图.如果这也没动力那就没救了. GitHub 地址: https://github.com/injetlee/Python/blob ...

  9. python爬虫-爬妹子图_Python 爬虫入门之爬取妹子图

    Python 爬虫入门之爬取妹子图 来源:李英杰  链接: https://segmentfault.com/a/1190000015798452 听说你写代码没动力?本文就给你动力,爬取妹子图.如果 ...

最新文章

  1. [转]VSTO Office二次开发RibbonX代码结构
  2. 用python画简单房子-python绘图作业:使用pygame库画房子
  3. 只靠可视化大屏,做不了数字化,数据总监总结3点,你做到了几个
  4. JDK1.8 中 ConcurrentHashMap源码分析(一)容器初始化
  5. Spotlights
  6. javascript入门系列演示·三种弹出对话框的用法实例
  7. html响应式布局media,JS中使用media实现响应式布局_飛雲_前端开发者
  8. java adt eclipse_在eclipse中添加android ADT
  9. 点云算法在条码识别任务中的应用
  10. captura 录制出来的是黑屏_黑屏:我录制的视频播放时画面是黑的解决方案 - Bandicam(班迪录屏)...
  11. 微信群控系统源码,微信云控系统源码的升级版,一部手机操作100个微信号的核心源码实现,核心技术架构
  12. 【零基础学Python】Day8 Python基本数据类型之Dictionary
  13. 苹果手机显示没有连接服务器怎么办啊,苹果手机更新连接到服务器出现问题怎么办...
  14. WebRTC协议学习之一(WebRTC简介)
  15. jQuery 的 slideUp 动画,当鼠标快速连续触发, 动画会滞后反复执行,该如何处理呢
  16. Domino内置备份功能妙用
  17. 【HGNN】北邮循序渐进研究HGNN
  18. 我的世界python指令_我的世界Minecraft从0开始学指令。
  19. centos c++ mysql_腾讯云Linux CentOS C++连接MySQL
  20. Arbitrum上首个跨链互操应用开启空投计划!

热门文章

  1. Knockout 事件传递参数的方法
  2. 2009年A股各板块龙头股大全(转载)
  3. css(显示与隐藏、溢出)
  4. 软工之404 Note Found团队
  5. 如何在自己网站上播放上传到优酷的视频
  6. 使用SquirrelMail配置Webmail系统,并实现通Macallan Mail Solution邮件服务器的连接
  7. 10款国外免费网站在线监控服务工具
  8. leetcode五月每日一题 leetcode974
  9. ERR_SSL_PROTOCOL_ERROR浏览器解决办法
  10. 移动物联网卡流量分省内省外吗?物联卡有漫游吗?