大家好  我是阿喵

今天教大家用如何用爬虫爬取可爱小姐姐的美照

第一步:现将python环境搭建好,工欲利其事必先利其器!
第二步:寻找目标网站,我选择的网站是http://www.win4000.com,里面有一个美女板块,里面有各种小姐姐的照片(你懂的)

第三步:分析目标网站的html源码及网页规则
通过分析我发现,该网页每个人物的每个图片都是
http://www.win4000.com/meinv1_2.html
http://www.win4000.com/meinv1_3.html
http://www.win4000.com/meinv2_1.html
http://www.win4000.com/meinv2_2.html
并且所有图片地址都存放在一个中

# coding:utf-8
from bs4 import BeautifulSoup   #引用BeautifulSoup库
import requests                 #引用requests
import os                       #os
root = 'D://img//'              #配置存储路径,我配置的是自己电脑中的D:/img文件夹
for page in range(1,1000):      #配置爬取页码,我这边配置的是1000个人的图片for p in range(1,20):       #配置爬取每个人多少张的参数,我这边配置的是每个人20张url = 'http://www.win4000.com/meinv'+str(page)+'_'+str(p)+'.html'r = requests.get(url)                       #使用requests中的get方法获取整个网页r.encoding='utf-8'                          #设定网页所使用的编码方式,错误的编码方式会导致乱码if r.status_code!=404:                      #判断生成后的链接是不是能访问,只有能访问才能爬取下载demo = r.text                           #将爬取后的对象通过text方法提取出所有的htmlsoup = BeautifulSoup(demo, "html.parser")#使用BeautifulSoup库进行整合,第二个参数使用lxml一样的,lxml兼容性好较好,速度较快text = soup.find_all('img',class_ = 'pic-large')#选取整合后我们需要的部分内容,选取后的数据为list数组for img in text:imagr_url = img.get('data-original')        #取出img标签中data-original中的值file_name = root + imagr_url.split('/')[-1] #取出图片地址中文件及文件扩展名与本地存储路径进行拼接try:if not os.path.exists(root):            #判断文件夹是否存在,不存在则创建文件夹os.mkdir(root)if not os.path.exists(file_name):       #判断图片文件是否存在,存在则进行提示s = requests.get(imagr_url)         #通过requests.get方式获取文件# 使用with语句可以不用自己手动关闭已经打开的文件流with open(file_name, "wb") as f:  # 开始写文件,wb代表写二进制文件f.write(s.content)print("爬取完成")else:print("文件已存在")except Exception as e:print("爬取失败:" + str(e))

哈哈哈哈大功告成,以下是成果展示

总结:
1、该方式爬取为单进程爬取,只能一张一张爬取
2、进行图片请求时一定要注意不要使用之前使用过的变量
3、细心、认真、不浮躁


看完文章如果大家觉得有帮助,记得一键三连哦,非常感谢,在这里还是要推荐下我自己建的Python学习群:609616831,群里都是学Python的,如果你想学或者正在学习Python ,欢迎你加入,大家都是软件开发党,不定期分享干货(只有Python软件开发相关的),包括我自己整理的一份2020最新的Python进阶资料和零基础教学,欢迎进阶中和对Python感兴趣的小伙伴加入!


Python爬取小姐姐美照相关推荐

  1. Python爬取小姐姐图片

    使用Python爬取小姐姐图片 首先上网站链接 唯美女生 爬取图片主要分为一下几步: 1.打开一个你喜欢的小姐姐的网站 E.g xiaojiejie web 2.下载并安装python环境 pytho ...

  2. Python爬取小姐姐内衣信息,寻找小姐姐们的偏好

    今天继续来分析爬虫数据分析文章,一起来看看网易严选商品评论的获取和分析. 警告:本教程仅用作学习交流,请勿用作商业盈利,违者后果自负!如本文有侵犯任何组织集团公司的隐私或利益,请告知联系阿喵删除!!! ...

  3. python 爬取豆瓣的美剧

    pc版大概有500条记录,mobile大概是50部,只有热门的,所以少一点 url构造很简单,主要参数就是page_limit与page_start,每翻一页,start+=20即可,tag是&quo ...

  4. python爬虫获取图片无法打开或已损坏_Python爬取小姐姐图片

    爬取图片主要分为一下几步: 1.打开一个你喜欢的小姐姐的网站 2.下载并安装python环境 3.开始编码 python 全部代码如下 # requests 请求 需要提前在Terminal中安装 p ...

  5. python爬虫 爬取小姐姐图片

    前言 大致熟悉了python的基础语法以后,开始学习爬虫基础. 一.爬取前的准备工作 python3.7环境(只要是python3版本都可以): 依赖包 : time requests re (缺少包 ...

  6. python爬虫爬取小姐姐图片(5762张)

    接触爬虫的第一天 第一步:现将python环境搭建好,工欲利其事必先利其器! 第二步:寻找目标网站,我选择的网站是http://www.win4000.com,里面有一个美女板块,里面有各种小姐姐的照 ...

  7. python下载图片代码并解析_Python爬取小姐姐图片代码_批量下载

    本帖最后由 OnlineYx 于 2021-1-13 14:44 编辑 我试着改了一下,写了个循环和判断,输出起始网页的ID和结束网页的ID就能批量地下载小姐姐了. 001.png (83.38 KB ...

  8. Python爬虫实战:爬取小姐姐最近的听歌曲目

    前言 作为网易云村的深度用户,网易云音乐应该是我除了微信外打开时间最长的 App 了.并不是应为网易云上面的歌曲多,而是因为那些走心的评论.边听歌边刷评论,感觉就像是走进了他人的人生之中,从另外一种意 ...

  9. python网易云听歌时长_Python爬虫实战:爬取小姐姐最近的听歌曲目

    前言 作为网易云村的深度用户,网易云音乐应该是我除了微信外打开时间最长的 App 了.并不是应为网易云上面的歌曲多,而是因为那些走心的评论.边听歌边刷评论,感觉就像是走进了他人的人生之中,从另外一种意 ...

最新文章

  1. 零起点学算法02——输出简单的句子
  2. 测试总监7天整理的那些高频而真实的软件测试面试题,速来get
  3. 疫情严重!国内互联网公司上班时间汇总!
  4. 《富爸爸 辞职创业前的10堂课》文摘
  5. 理解Linux和其他UNIX-Like系统上的平均负载
  6. 子之错父之过什么意思_胎教是什么意思?胎教有何意义?
  7. ADO学习(十)DataGrid控件的使用
  8. 最流行的 IDE 之争:Eclipse 反超 Visual Studio 成第一
  9. idea调试代码步入用法
  10. java开发表格,JAVA开发简历表格下载
  11. Pandas:用Python做日报(重构)
  12. 机器学习中的多分类任务详解
  13. 大数据人工智能常用特征工程与数据预处理Python实践(2)
  14. golang中channel的传递
  15. php菱形循环代码,PHP练习–用for循环打印空心菱形,for菱形_PHP教程
  16. 写一个可以一键统一调整word文档格式的程序
  17. C语言:习题4-5 换硬币 (20分)
  18. 与安装应用签名不同怎么解决_手动签名安装掉证书应用、多开任意应用教程
  19. 【猛料】腾讯前总监受贿侵占数百万获刑9年
  20. 拍网剧要具备哪些东西

热门文章

  1. 男人最碰不得的十大危险女人
  2. 计算机如何接6块显卡,双显卡怎么切换到独立显卡 5步轻松搞定【图文教程】
  3. Mathematica绘制动态椭圆摆线(一)
  4. 基于知识图谱的知识推理
  5. maven profiles勾选不了
  6. 记一次jstack线程诊断
  7. 学习opencv:PS滤镜—马赛克
  8. AD软件绘制stm32最小系统电路原理图与PCB图
  9. 人生算法之「延迟满足感」
  10. 想想五年后的你,什么工作值得你去拼命? 转~ 推迟满足感 成长比成功重要