标题 最新 用Python 批量爬取网上美眉图片

故事是这样的:七月份给室友说,我要开始学习Python了。室友一脸懵,并问我Python是啥?确实对于我这个小城市来说Python之风还没有吹到我们这里来,以至于在我们大学都没有开设这门课!很是尴尬。要不是在网上听说Python很牛我也不会接触到。于是我便给室友说了Python的强大,可是我却遭到了室友的嘲笑。呜呜呜……。“士可杀不可辱。”我立下豪言壮志说:“三个月后我给你做出一个能批量获取网上你最爱图片的程序,给你瞅瞅!”。于是……

当然,关于这方面博客上面有很多例子,但我读了之后发现不是怎么会,不太易懂。在这里我以小白的身份写下了这篇博客,希望可以帮到更多的小白!(毕竟不能丢了咱Python的脸,哈哈哈。)

我目前自学了:Python基础知识,Python爬虫知识(仅限requests库、os库、BeautifulSoup库、re库、正则表达式)
好啦,不废话了,咱们开始!

import requests
from bs4 import BeautifulSoup
import traceback
import re
import os
import time
#我是新手,先定义的主函数,这样我的头脑清晰一些!
def main():A_url = "http://www.win4000.com/meinvtag2.html"B_url = ""lsM = []  #用来储存目录网址链接的呦!lsZ = []  #用来储存每张图片连接的呦!getMULIANJIE(lsM,A_url)for i in lsM:for k in range(20):   #这里我大概看了一下每一个母相册后面的子照片都没有超过20个的,所以用的20!if k == 0:B_url = "http://www.win4000.com/mein" + i + ".html"else:B_url = "http://www.win4000.com/mein" + i + "_" + str(k) + ".html"getPHOTO(B_url,lsZ)for j in lsZ:for m in j:downPHOTO(m)#解析网页
def getHTMLText(url):try:r = requests.get(url)r.raise_for_status()r.encoding = r.apparent_encodingreturn r.textexcept:return ""#获取网页链接目录
def getMULIANJIE(ls,url):html = getHTMLText(url)soup = BeautifulSoup(html,'html.parser')a = soup.find_all('a')for i in a:try:href = i.attrs['href']ls.append(re.findall(r"[meinv]\d{6}",href)[0])except:continue#获取照片链接
def getPHOTO(urlb,ls):ls.clear()html = getHTMLText(urlb)ls.append(re.findall('url="(.*?)"',html))#下载图片
def downPHOTO(url):root = "D://tupian//"path = root + url.split('/')[-1]try:if not os.path.exists(root):os.mkdir(root)if not os.path.exists(path):r = requests.get(url)with open(path,'wb') as f:f.write(r.content)f.close()print("文件保存成功!")else:print("文件已经存在!")except:print("爬取失败!")time.sleep(0)main()

好啦!一切大功告成,我可以去我室友哪里显摆了!
其实我的代码还可以简写很多的,可是我觉得这样的话小萌新更容易理解!
Python是真的强大,我要继续学习了。

人生苦短,我学Python!

最新 用Python 批量爬取网上图片相关推荐

  1. python爬虫笔记(八) 实例3:用Python批量爬取全站小说【以书趣阁为例】

    1. 用Python批量爬取全站小说 爬取这个网站小说:http://www.shuquge.com/txt/89644/index.html 2. 爬取一本书 # -*- coding: utf-8 ...

  2. python自动搜索爬取下载文件-python批量爬取下载抖音视频

    本文实例为大家分享了python批量爬取下载抖音视频的具体代码,供大家参考,具体内容如下 import os import requests import re import sys import a ...

  3. 疫情过去女朋友想去重庆玩,python批量爬取小猪短租重庆民宿信息

    疫情过去女朋友想去重庆玩,python批量爬取小猪短租重庆民宿信息 随着时间的流逝,在中国共产党的领导,全国人民的共同努力下,疫情逐渐受到了控制,逐渐好转,复工,开学有望.最近在和女朋友的闲聊当中得知 ...

  4. Python批量爬取王者荣耀英雄高清壁纸

    Python批量爬取王者荣耀英雄高清壁纸 文章目录 Python批量爬取王者荣耀英雄高清壁纸 前言 爬虫步骤 python代码实现 总结 前言 很多喜欢玩王者的朋友很希望把王者荣耀的英雄图片拿来做壁纸 ...

  5. python 批量爬取网易云音乐,java解密

    每天一点点,记录学习 python 批量爬取网易云音乐 网易云音乐,排行榜,右键,显示网页源代码,并不能找到任何一首歌的id,是因为java加密了 随便找一首id为1374061038的歌,在网页源代 ...

  6. python webshell_使用 Python 批量爬取 WebShell

    使用 Python 批量爬取 WebShell 还在用爬虫爬一些简单的数据?太没意思了!我们来用爬虫爬 WebShell! 0. 引子 前些天访问一个平时经常访问的网站,意外的发现这个站出了问题,首页 ...

  7. python爬虫爬取图片代码_Python爬虫入门:批量爬取网上图片的两种简单实现方式——基于urllib与requests...

    Python到底多强大,绝对超乎菜鸟们(当然也包括我了)的想象.近期我接触到了爬虫,被小小地震撼一下.总体的感觉就两个词--"强大"和"有趣".今天就跟大家分享 ...

  8. python爬虫快速下载图片_Python爬虫入门:批量爬取网上图片的两种简单实现方式——基于urllib与requests...

    Python到底多强大,绝对超乎菜鸟们(当然也包括我了)的想象.近期我接触到了爬虫,被小小地震撼一下.总体的感觉就两个词--"强大"和"有趣".今天就跟大家分享 ...

  9. Python批量爬取简历模板

    文章目录 前言 一.需求 二.分析 1. 查看网页源码(ctrl+u) 2.进一步分析 三.处理 四.运行效果 前言 为了更好的掌握数据处理的能力,因而开启Python网络爬虫系列小项目文章. 小项目 ...

最新文章

  1. 为什么我强烈推荐你学习 Java ?(必看)
  2. python 科学计算设计_Python科学计算——Data Structures
  3. xfermode的基本用法
  4. 云小课 | 华为云KYON之ELB混合负载均衡
  5. 小米员工爆料:Redmi K30 Pro自动亮度调节做得很好
  6. 从拨号到 5G :互联网登录完全指南
  7. Docker + Spring Boot + FastDFS 搭建一套分布式文件服务器,太强了!
  8. BIGO 使用 Flink 做 OLAP 分析及实时数仓的实践和优化
  9. SQLServer2008不允许保存更改
  10. SCI文章写作攻略—起飞站
  11. Espresso Test 7: Idling resource
  12. 适配ipad Pro
  13. STM32芯片ADC内部的CH17参考电压的用途
  14. 微信麻将连接服务器失败,微乐麻将授权失败是怎么回事?微乐麻将怎么用微信登录?...
  15. idea连接mysql数据库下载驱动失败
  16. java河南口腔医疗机构线上服务系统计算机毕业设计MyBatis+系统+LW文档+源码+调试部署
  17. 关于如何将java桌面程序打包成exe可执行文件
  18. android设置EditText为不可编辑状态
  19. c蔚语言艺术,晚唐张乔诗歌的语言艺术与美学风格-中国社会科学网.PDF
  20. ssl证书怎么购买?买多少钱的ssl证书合适?

热门文章

  1. OA办公系统选型标准知多少?
  2. 求职OMG——大学生就业指导与技能开发 第一章测试
  3. linux没有检测到触摸板,linux – 未检测到触控板
  4. 深思:一个农村大学生眼中的农村经济(天涯)
  5. 如何才能有效清除新房甲醛
  6. 新手必看!51单片机指令快速记忆法
  7. 纯java离线版语音转文字
  8. 浅谈中国十大国产MOS管品牌哪个好?
  9. python基础-零基础入门到精通
  10. 互联网晚报 | 11月5日 星期五 | 中国移动A股IPO成功过会;腾讯会议用户数近2亿;荣耀智能制造产业园首次亮相...