大致步骤:

第一步:找到我们要爬取的网站 https://www.vmgirls.com/这是个妹子图片的私人网站

第二步:打开Vscode或者Pycharm都可以 复制我的代码,详细的解释写好了

ps:requests库需要手动下载,按win+R输入cmd进入命令行模式,输入pip install
requests安装requests库。

第一部分,请求网页。

# 导入requests库
import requests # 导入re正则表达式库
import re # 导入系统内置库
import os headers = {'user-agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36'
}# 用request.get方法访问网址得到网页HTML内容
response = requests.get('https://www.vmgirls.com/12985.html', headers = headers)#网页内容以文本形式打印出来
html = response.text 

设置标题headers防止反爬,标题这样设置的原因是因为我们要模仿我们真的是从这个网页下载图片而不是通过python来获取图片,所以用网站的标题就行了。
查看网站的标题: 在网页中按F12,在菜单栏中选择network可以看到网页的headers,复制粘贴就可以得到原headers了!

第二部分,获取网页内容

#为文件夹起名字用图片的名字命名。
dir_name = re.findall('<h1 class="post-title h3">(.*?)</h1>', html)[-1] # 如果文件夹不存在那么就建立文件夹,不然就不建立
if not os.path.exists(dir_name):os.mkdir(dir_name)# 获取图片地址
urls = re.findall('<a href="(.*?)" alt=".*?" title=".*?">', html)# 打印获得的urls
print(urls)

第三部分,保存图片

# 通过for循环来遍历筛选过的urls,然后分别下载保存!
for url in urls:file_name = url.split('/')[-1]response = requests.get(url, headers = headers)with open(dir_name + '/' + file_name, 'wb') as f:f.write(response.content)

以上是详细教程
完成啦!!!!!!!!!!!!!!

完整代码:

# 导入requests库
import requests # 导入re正则表达式库
import re # 导入系统内置库
import os headers = {'user-agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36'
}# 用request.get方法访问网址得到网页HTML内容
response = requests.get('https://www.vmgirls.com/12985.html', headers = headers)#网页内容以文本形式打印出来
html = response.text #为文件夹起名字用图片的名字命名。
dir_name = re.findall('<h1 class="post-title h3">(.*?)</h1>', html)[-1] # 如果文件夹不存在那么就建立文件夹,不然就不建立
if not os.path.exists(dir_name):os.mkdir(dir_name)# 获取图片地址
urls = re.findall('<a href="(.*?)" alt=".*?" title=".*?">', html)# 打印获得的urls
print(urls)# 通过for循环来遍历筛选过的urls,然后分别下载保存!
for url in urls:file_name = url.split('/')[-1]response = requests.get(url, headers = headers)with open(dir_name + '/' + file_name, 'wb') as f:f.write(response.content)

福利!!!Python爬取好看的妹子图!!!相关推荐

  1. 深夜,我用python爬取了整个斗图网站,不服来斗

    深夜,我用python爬取了整个斗图网站,不服来斗 QQ.微信斗图总是斗不过,索性直接来爬斗图网,我有整个网站的图,不服来斗. 废话不多说,选取的网站为斗图啦,我们先简单来看一下网站的结构 网页信息 ...

  2. Python 爬取表情包-斗图不会输在起跑线

                   Python 爬取表情包-斗图不会输在起跑线 对于酷爱聊天的朋友来说,表情包应该是他们心中的灵魂,没有图的聊天只能算虾扯蛋了.图片(表情包)赋予了聊天更多的内涵,很多时候 ...

  3. 利用python爬取历代中国行政图,从先周到中华人民共和国,jpg格式边框带经纬度,可自行配准矢量化

    古代地图,对于历史相关研究人员,是需要的工具,本想找到历代矢量的历史地图数据,但是发现很难有资源,因此只能找到已经公开制图了jpg数据,如果你有耐心,可以配准后矢量化,获取历代矢量数据,不够工作量浩大 ...

  4. 每日一笑,Python爬取全网baisi趣图

    2019独角兽企业重金招聘Python工程师标准>>> 前言 baisi里面有各种各样的趣图,搞笑视频,搞笑GIF图,搞笑段子,Python为你批量下载全网最搞笑的图片,让你每天都能 ...

  5. Python爬取张家界风景美图

    这里利用周末的时间复习了一下关于爬虫的一些基本知识,分别是requests, BeautifulSoup库的基本知识: 如果还有不会的可以去看看这些内容: 参考 requests库 requests实 ...

  6. 我用python爬取了整个斗图网站

    前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. PS:如有需要Python学习资料的小伙伴可以加点击下方链接自行获取 python免费学习资 ...

  7. Python爬取好看的风景照,速看!

    ​ 大家好,我今天给大家分享一个爬取图片的小爬虫,网站是挖好图. 接下来我们就先进行这个网站的板块的分析, 首先,我们按F12或者Ctrl + Shift + I打开开发者工具,切换到网络,然后点击F ...

  8. Python 爬取无版权美图

    这里还是为了温习,这里照例为了放水,涉及网址的地方,采取了url加密,一是scrapy,二是requests,首先是requests方法: import requests import re impo ...

  9. python爬取好看视频_Python 爬取好看视频

    importrefrom bs4 importBeautifulSoupimporturllib.requestimportrequestsimportrandomdefxiazai(url): ur ...

最新文章

  1. 关于javascript:void(0);,herf=”#”以及在IE6下,click事件失效的问题
  2. 网络配置_Linux网络环境配置
  3. 变频电机转矩频率特性曲线_伟创变频器
  4. poj 3254 Corn Fields 状态压缩dp
  5. C++远航之封装篇——深拷贝、浅拷贝
  6. 最新软件工程总结,项目模板,软工作业下载
  7. 竞价排名才是万恶之源
  8. 骑马与砍杀服务器修复,骑马与砍杀修复存档损坏的办法
  9. html 和 css 代码 总结
  10. Linux mail 命令(smtp.163.com)
  11. CIE 国际照明委员会
  12. Qt 动态实时显示波形图
  13. 黑马程序员匠心之作|C++教程从0到1入门编程-c++核心编程
  14. 网易云音乐、QQ音乐一键下载工具(Go语言)
  15. C程序设计基础期末考试复习
  16. facebook使用教程_保持知情的方法有很多。 为什么限制自己使用Facebook?
  17. NLP必不可少的中文数据资源
  18. html字体自动放大,让用户自己控制网页字体的大小的css书写方法
  19. 一些Dot Net 里面的概念
  20. 解决苹果M1芯片无法通过绿联转接器连接网线的问题

热门文章

  1. CentOS7下的LAMP搭建
  2. RESTful Api 身份认证总结
  3. prompt set feedback off set define off (转)
  4. 幻影机器人庄园讲解员_探索之旅——莘城海粟幼儿园秋游活动
  5. 数据通信原理_华为面向全球发布Datacom认证 未来三年培养15万数据通信网络人才...
  6. 读 S. Meyers 之 《Effective STL 中文版:50条有效使用 STL 的经验》
  7. 新近诗作 - 我在找寻什么
  8. 《C和指针》阅读笔记
  9. 【数值溢出】从二进制的角度看数值溢出
  10. 微软 Edge 浏览器怎样安装插件