咳咳直接上代码

#!/usr/bin/env python
# -*- coding: utf-8 -*-
# @Time    : 2021/01/04 18:10
# @Author  : 志伟
# @File    : 图库大全1000.py
# @Software: PyCharm
import requests
from lxml import etree
import osif __name__ == '__main__':headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.183 Safari/537.36'}m_path = './1000图库'if not os.path.exists(m_path):os.mkdir(m_path)for i in range(1, 2):url = f'https://www.1000tuku.com/guoneimeinv/list_5_{i}.html'resp = requests.get(url=url, headers=headers).texttree = etree.HTML(resp)href_list = tree.xpath('/html/body/div[4]/ul//@href')for href in href_list:resp1 = requests.get(url=href, headers=headers)# 处理中文乱码问题resp1_text = resp1.text.encode('ISO-8859-1').decode('GB18030')tree1 = etree.HTML(resp1_text)page_num = int(tree1.xpath('//*[@id="content"]/div[1]/div[2]/ul/li[1]/a/text()')[0][1:3])title = tree1.xpath('/html/head/title/text()')[0]title_path = m_path + f'/{title}'if not os.path.exists(title_path):os.mkdir(title_path)for j in range(1, page_num + 1):if j == 1:every_herf = hrefelse:every_herf = href.replace('.html', f'_{j}.html')resp2 = requests.get(url=every_herf, headers=headers).texttree2 = etree.HTML(resp2)src_list = tree2.xpath('//*[@id="content"]/div[1]/div[1]//@src')for src in src_list:jpg_data = requests.get(url=src, headers=headers).contentjpg_name = src.split('/')[-1]jpg_path = title_path + f'/{jpg_name}'with open(jpg_path, 'wb') as fp:fp.write(jpg_data)print(jpg_name, '下载完成')

咳咳,看看效果

放学啦,回家吃饭去吧

Python爬虫_宅男福利?妹纸勿点__一蓑烟雨任平生相关推荐

  1. python怎么爬取_宅男福利,教你怎么用Python爬取漫画

    抓取漫画的由来也是看了知乎上有人说用爬取漫画,然后自己也玩玩 首页中每个漫画的url是类似这样存储的: K.O.I 偶像之王 然后用lxml通过cssselect(tr>td>a)将能用到 ...

  2. 一个简单的爬虫脚本--宅男福利

    闲来无事,扒一扒那些美女们的照片 import urllib.request url = "http://img1.mm131.com/pic/2537/" for i in ra ...

  3. python爬虫_网易音乐歌单

    小白flag7 python爬虫_网易音乐歌单 准备 import os #存放文件处理 import time #程序运行时间计算 import sys #错误信息返回 预留 from seleni ...

  4. Python爬虫_案例分析(二)

    Python爬虫_案例分析(二) 一.电影天堂案例 import scrapy from scrapy_movie.items import ScrapyMovieItem class MvSpide ...

  5. Python爬虫_某宝网案例

    Python爬虫_某宝网案例 一.导入第三方库,确定url,定义headers ,伪装爬虫代码 import requests url = 'https://s.taobao.com/search?q ...

  6. python爬虫_抓取瓦片图片信息并将其拼接_以mapbar为例(适用交通工程类专业)

    python爬虫_抓取瓦片图片信息并将其拼接_以mapbar为例(适用交通工程类专业) 这次就以mapbar为例爬取道路交通拥堵情况 第一步,瓦片标号解析 第二步,拼url,然后下载 第三步,图片拼接 ...

  7. 高仿萌聚 app ,内容简直是宅男福利啊

    mengqu 项目地址:panacena/mengqu 简介:高仿萌聚 app ,内容简直是宅男福利啊! 高仿萌趣 app 最近下了个叫做"萌趣"的 app,内容简直是宅男福利啊! ...

  8. Python爬虫_音乐案例

    Python爬虫_音乐案例 [案例目的]:下载音乐 [第三方库]:1.requests 2.perttytable [开发环境]:1.Python3.8 2.PyCharm 2022.1 # http ...

  9. 使用python抓取百度漂流瓶妹纸照片

    无意中发现贴吧也出了个漂流瓶的东西,随手翻了翻发现居然有好多妹子图,闲来无事于是就想写个爬虫程序把图片全部抓取下来. 这里是贴吧漂流瓶地址 http://tieba.baidu.com/bottle. ...

  10. Python 爬虫入门(二)——爬取妹子图

    Python 爬虫入门 听说你写代码没动力?本文就给你动力,爬取妹子图.如果这也没动力那就没救了. GitHub 地址: https://github.com/injetlee/Python/blob ...

最新文章

  1. c语言 文件名变量,C语言中,如何用根据不同的变量来更改文件名?
  2. 你还不了解基于session的授权认证吗?
  3. 『TCP/IP详解——卷一:协议』读书笔记——03
  4. [转载]一个游戏程序员的学习资料
  5. js获取本月或指定月份的最后一天
  6. Linux学习总结(26)——Shell常用命令总结
  7. 三元组法矩阵加法java_C语言实现矩阵加法、减法、乘法和数乘运算
  8. USB-C 端口在您的 Mac 上无法使用如何解决?
  9. 尚硅谷SSM学习笔记
  10. 安卓11及以上adb命令将冰箱设置为设备管理员
  11. 大地测量学基础 (复习)
  12. 7-5 华氏度转摄氏度(四舍五入) (5分)_PTA_Java基础练习
  13. x86 x64 IA64的关系和区别
  14. autoCAD2014安装激活
  15. 【IoT】 产品设计之拆机报告:天猫精灵之万能红外遥控器
  16. 《Spring Boot极简教程》附录1 计算机简史
  17. php tipask yii 单点登录_favorite-link/README.md at master · cccthon/favorite-link · GitHub
  18. Visual Studio 2017项目进行打包并附加.net框架打包,菜鸟级安装教程
  19. 使用xshell来操作服务器
  20. SARscape数据处理SAR数据笔记——DINSAR微小形变提取

热门文章

  1. linux字符串替换命令,Linux系统字符串替换命令详细说明
  2. 什么是透明、匿名、高匿代理?详解!
  3. Java 操作Word书签:用文本、图片、表格替换书签
  4. 项目一 Part 4.2 基于网格搜索的超参数优化实战
  5. opencv之图像二值化处理
  6. 智慧新泰时空大数据与云平台_《智慧城市时空大数据与云平台建设技术大纲》(2017版)正式发布...
  7. 如何批量转换图片格式为jpg?
  8. MATLAB显示图像为什么一片白
  9. C语言指针和指针变量
  10. 通过PXE网络启动WinPE的方法