不羞涩社区图片爬取

  • 展示效果
  • 请求头
  • 获取网站的请求数据
  • 提取数据
  • 保存数据
  • 完整代码

展示效果

PS:仅供学习交流,侵删。




请求头

我下面就不一一解释了,小白没有基础的看不懂没关系,拿代码是可以直接运行的了,至于懂的也都懂了,没有基础的朋友建议可以从Python基础开始看看,我专栏也有写过Python基础的内容,感兴趣的话自己去看看吧。

headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.88 Safari/537.36'
}

获取网站的请求数据

def RequestIndex(page):url = 'https://www.buxiuse.com/?page={}'.format(page)response = requests.get(url,headers=headers).text# print(response.text)return response

提取数据

def dataEX(index):"""数据提取 获取到在HTML里面的图片URL"""# 数据初始化 学习资料领取关注左上角wx公众号点击福利即可领取doc = pq(index)height_min = doc('.height_min').items()# 转换成数据集for i in height_min:imgUrl = (i.attr('src'))print("正在下载", imgUrl)

保存数据

def ImgSave(imgUrl):global countresponse = requests.get(imgUrl,headers=headers)with open("./不羞涩小姐姐们/{}.jpg".format(count),"ab") as f:f.write(response.content)count += 1

完整代码

# 1.获取网站的请求数据
import requests
from pyquery import PyQuery as pqheaders = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.88 Safari/537.36'
}
count = 1
# 1.获取网站的请求数据
def RequestIndex(page):#     url 网址url = 'https://www.buxiuse.com/?page={}'.format(page)#     headers##     response 发送请求,返回响应response = requests.get(url,headers=headers).text# print(response.text)return response# 2.提取数据
def dataEX(index):"""数据提取 获取到在HTML里面的图片URL"""# 数据初始化doc = pq(index)# 图片url的提取height_min = doc('.height_min').items()# 转换成数据集for i in height_min:imgUrl = (i.attr('src'))print(imgUrl)ImgSave(imgUrl)
# 图片保存
# 请求图片地址 并且保存到本地 ab不覆盖保存 wb 二进制写入
def ImgSave(imgUrl):global countresponse = requests.get(imgUrl,headers=headers)with open("./不羞涩小姐姐们/{}.jpg".format(count),"ab") as f:f.write(response.content)count += 1if __name__ == '__main__':for page in range(1,10):index = RequestIndex(page)dataEX(index)

不羞涩社区图片爬取,我真的不是为了看小姐姐私照,从未这么渴望过知识!相关推荐

  1. 通过爬取微博评论,发现好看的小姐姐...

    通过爬取微博评论,发现好看的小姐姐... 前言 页面分析 技术栈 架构 关键点 成果 前言 刷微博刷到一个博主求好看小姐姐照片的微博,内心不由得轻蔑一笑,好看的小姐姐凭啥理你,滑到评论区,我瞬间就酸了 ...

  2. 爬取唯美女生网站上所有小姐姐的照片

    爬取唯美女生网站 前几天刚好看到有人在教学爬取唯美女生网站(https://www.vmgirls.com)的图片,大致听了一下,只是介绍了一次爬取某一个小姐姐的照片,因此就尝试做一个爬取全站小姐姐照 ...

  3. 【Python爬虫实战】爬取5K分辨率超清唯美小姐姐壁纸

    目录 简介 使用教程 编写思路 演示图片 全部代码 简介 壁纸的选择其实很大程度上能看出电脑主人的内心世界,有的人喜欢风景,有的人喜欢星空,有的人喜欢美女,有的人喜欢动物.然而,终究有一天你已经产生审 ...

  4. Python3爬虫项目集:爬取知乎十几万张小姐姐美图

    文章目录 前言 注意点 代码实例 前言 github:https://github.com/pasca520/Python3SpiderSet 知乎上有很多钓鱼贴,也成功的钓上了很多鱼,你懂的~~~ ...

  5. 爬虫实战:过年你被催婚啦吗?爬取相亲网站,看看当下年轻小姐姐的择偶观。

    前言 到了一定年龄,父母可能会催你找女朋友,结婚. 大多数的父母催婚,是父母渐渐老了,想让你找个人照顾你,有热饭吃,生病了有人照顾.在外面不被人欺负. 当然,也有一部分来自周围人的压力,跟你同龄的孩子 ...

  6. 过年你被催婚了吗?爬取相亲网站,看看当下年轻小姐姐的择偶观

    到了一定年龄,父母可能会催你找女朋友,结婚. 大多数的父母催婚,是父母渐渐老了,想让你找个人照顾你,有热饭吃,生病了有人照顾.在外面不被人欺负. 当然,也有一部分来自周围人的压力,跟你同龄的孩子差不多 ...

  7. SpiderMan:异步加载,图片爬取,数据库存储,多进程爬虫,IP代理

    1,使用API 1.1,API使用方法 API是通过Requests请求和服务端的Response回应来完成API的一次调用,所以用Python语言进行API的调用时,便可以使用Requests库来进 ...

  8. Python图片爬取方法总结

    1. 最常见爬取图片方法 对于图片爬取,最容易想到的是通过urllib库或者requests库实现.具体两种方法的实现如下: 1.1 urllib 使用urllib.request.urlretrie ...

  9. python爬虫图片-Python图片爬取方法总结

    1. 最常见爬取图片方法 对于图片爬取,最容易想到的是通过urllib库或者requests库实现.具体两种方法的实现如下: 1.1 urllib 使用urllib.request.urlretrie ...

  10. 图片爬取数据解析数据持久化

    文章目录 1.图片下载 2.JS动态渲染 3.数据解析 4.持久化存储 1.图片下载 百度图片:http://image.baidu.com/ 搜狗图片:https://pic.sogou.com/ ...

最新文章

  1. CV领域最经典的Paper是什么来头?
  2. 【Linux】 任务调度/计划 cron
  3. PHP - NetBeans中调试PHP
  4. Vue中使用html2canvas和jspdf插件实现导出pdf(自定义html样式可带图片)并下载
  5. 线程/协程/异步的编程模型(CPU利用率为核心)
  6. java 后端校验_如何实现Java后端数据校验?看这篇就足够!
  7. 设计模式之观察者模式--中英文结合理解版
  8. 学习UpdatePanel控件
  9. fltk在UbuntuLinux中搭建和测试-《C++程序设计原理与实践》Chapter12:显示模型 环境构建...
  10. sublime怎么运行go_go语言环境搭建+sublime text3(windows环境下)
  11. 【房价预测】基于matlab GM模型房价预测【含Matlab源码 346期】
  12. Oracle Crystal ball 11.1.* 注册码
  13. 免费音效素材,拿走不谢。
  14. fusioncharts java_FusionCharts在Java中的基本使用(2)
  15. timenote时光笔记+android,Time Note时光笔记软件怎么样?Time Note时光笔记有哪些功能特色?...
  16. 压电式雨量传感器数字感知降雨量
  17. 苹果Mac电脑中如何将键盘当作鼠标使用?
  18. Markdown支持的emoji图标
  19. 图像识别(二)| 图像的色彩空间
  20. 初识GeneXus产品

热门文章

  1. 重构手法46:Parameterize Method (令函数携带参数)
  2. 2008服务器系统备份工具,服务器2008系统备份
  3. 65.(cesium篇)cesium单个地图图片
  4. 提示GuestAdditions versions on your host (6.1.32) and guest (6.1.22) do not match错误的解决方法
  5. pygame:超级玛丽
  6. access有效性规则不为空值_access窗体文本框有效性规则中输入is not null无效
  7. 序列化字段的跨表查,choice字段显示中文,
  8. 开机提示grub可咋办啊
  9. Fractions to Decimals_usaco2.4.5_暴力
  10. 联想win10专业版64位简体中文原版光盘镜像