python爬取妹子图网健康图片
为了博取大家的眼球,博主选了这个题材,现实生活中博主很正直的人,嗯
废话不说
demo,本demo只爬取了封面图片,内部图片方法相同
import requests
from pyquery import PyQuery as pq
import osclass pachong:# 初始化def __init__(self,url,headers):self.url=urlself.headers=headersself.text=requests.get(self.url,headers=self.headers).textdef page(self):doc=pq(self.text)item=doc('.pagebar a')pages=[]for i in item:if pq(i).attr.href not in pages:pages.append(pq(i).attr.href)print(pq(i).attr.href)return pages# 妹妹图片提取与保存def storeImg(self,text):pageHtml=pq(text)imgs=pageHtml('li .img a')for i in imgs:img=pq(i)('img')title=pq(img).attr.altsrc=pq(img).attr.srctry:if not os.path.exists(r'C:\Users\XChen32\Desktop\meizi\image'):os.makedirs(r'C:\Users\XChen32\Desktop\meizi\image')content=requests.get(src,headers=self.headers).contentwith open(r'C:\Users\XChen32\Desktop\meizi\image\%s.jpg'%title,'wb+') as file:file.write(content)except:passdef startMain(self):pages=self.page()#第一页妹妹图片爬虫self.storeImg(self.text)#其他页妹妹图片爬虫for page in pages:text = requests.get(page, headers=self.headers).textself.storeImg(text)headers = {"User-Agent": "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.146 Safari/537.36"}
url=r"https://www.lnlnl.cn/meizitu/"storeMM=pachong(url,headers)#pages=storeMM.page()
storeMM.startMain()
注意事项:需要添加headers
pyquery包的使用方法本文不讲术
HTML分析
li是当前页的所有图片
这里是li的封面图片以及整个专辑的地址,本文没做爬取
这里是一共多少页图片
这里是结果:
python爬取妹子图网健康图片相关推荐
- 使用python爬取斗图网的图片
使用python爬取斗图网的图片 以下是代码部分: # -*- coding: utf-8 -*- """ Created on Wed Apr 14 14:41:42 ...
- 用scrapy爬取妹子图网的图片,附上源代码
实现这个是因为之前在谋个公众号里面看到一篇文章,关注了也拿不到源代码 ,所以就自己写了一个爬取这个网站图片的功能.个人觉得这个网站的图片就一般吧. 开始 环境,py3, win, linux下运行都是 ...
- 用Python爬取彼岸图网图片
用Python爬取彼岸图网图片 *使用了 四个模块 import time import requests from lxml import etree import os 没有的话自行百度安装. ...
- python爬取千图网_python爬取lol官网英雄图片代码
python爬取lol官网英雄图片代码可以帮助用户对英雄联盟官网平台的皮肤图片进行抓取,有很多喜欢lol的玩家们想要官方的英雄图片当作自己的背景或者头像,可以使用这款软件为你爬取图片资源,操作很简单, ...
- python爬虫爬妹子图_【爬虫】直接上干货-爬取妹子图整站图片
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼 #coding=utf-8 import os import requests from lxml import etree import time cl ...
- python爬取妹子图片1_【爬虫】直接上干货-爬取妹子图整站图片
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼 #coding=utf-8 import os import requests from lxml import etree import time cl ...
- python爬取千图网图片并保存_Python数据分析与挖掘实战-课程作业5爬取千图网某个频道的高清图片...
作业要求:爬取千图网(http://www.58pic.com)某个频道的高清图片 作业难点:正确找到图片链接并用正则表达式写出 代码如下: """ Created on ...
- 爬取彼岸图网4k图片
爬取彼岸图网高清美女图片 代码如下
- python爬取捧腹网gif图片
#_*_coding:utf-8_*_ #爬取捧腹网GIF图片 import urllib,re import urllib.request import chardet #需要导入这个模块,检测编码 ...
最新文章
- 微信小程序wxparse内容页显示不出来不能正确解析html代码
- 左神算法课笔记(二):链表、栈和队列、递归Master公式、哈希表、有序表
- python 字符集utf-8|精简版(三分钟了解)
- oracle 表删掉了_分区,Oracle 删除表分区
- _软件园三期西片区F地块举行招商推介会 超300家企业意向落户 - 本网原创
- python单例模式数据库连接池_《java设计模式》一文带你了解单例模式
- 随笔记--Pycharm中Terminal字体大小的设置
- 【IDEA】IDEA怎么汉化汉化后怎么转回英文
- python实战:基于链家网二手房数据解析任务
- 计算机computer英语划分音节,英语基础知识1.computer有___个音节,按划分音节的规则,应为____.A.1;computer B.2;com...
- hr标签html样式,hr标签样式修改及美化(css的hr标签实现精美线条)
- python应用——简单的跟随北上资金策略
- 二氧化硅纳米微球光子晶体乳液聚合聚苯乙烯核壳结构/中空二氧化硅/钛纳米微球的制备方法
- matlab设置x轴和y轴的坐标显示范围和刻度
- 七.面向对象编程(中)
- windows主机如何登录阿里云服务器
- python蟒蛇画法
- 第44章 	MPU6050传感器—姿态检测—零死角玩转STM32-F429系列
- linux freetype 安装
- Eclipse Che安装入门和使用(一)
热门文章
- JAVA登录界面学生和老师_学生信息管理系统之第三篇登录界面java代码
- QT-学生信息管理系统
- MIT CMS.300 Session 5 – UNWRITTEN RULES 游戏的潜在规则
- 如何顺利通过c语言补考,大学里补考比考试难的学科,不想挂科最好认真学,尤其大一新生...
- 我虽买不起99朵玫瑰花送你,但它可以——(看完还不肯当我女朋友?)
- linux下eeprom读写测试,本科毕业设计__基于linux的eeprom的读写控制.doc
- WIN7 shutdown 定时/倒计时 命令关机
- 王者服务器维护7月九号,王者荣耀S20赛季确定7月9号开始,钻石夺宝新增猛男专用拖尾特效...
- ubuntu安装discourse论坛----结合在apache服务上建立虚拟主机
- vue2.x tui-image-editor图片编辑器的使用