背景:


最近部门领导交给笔者一个爬取百度关键词排名的任务。写好了基本功能,能不能正常使用呢?于是乎,有了本文,爬取一些美女图片,一来可以检验下爬虫效果;二来呢,也可以养养眼,给工作增加点乐趣不是,哈哈。废话少说,这就是要抓取的图片了,很养眼吧。直接上代码  地址:http://www.win4000.com/meitu.html

环境:(请读者自行配置)


Python3

urllib3

BeautifulSoup

requests

请读者自行查看审查元素,以确定抓取目标,完全生搬硬套,可能出问题

源代码:

download_meinv.py

import os

from urllib.parse import urlparse  #应该是urllib3模块带来的,如果不是的话,之后在使用的过程在根据报错信息进行解决吧

from bs4 import BeautifulSoup

import requests

'''导入模块时先导入系统库,在导入第三方库'''

'''爬取美女网站首页的所有照片'''

r = requests.get('http://www.win4000.com/meitu.html')

soup = BeautifulSoup(r.text,'html.parser')

img_list = []

for img in soup.select('img'):

if img.has_attr('alt'):

if img.has_attr('data-original'):

img_list.append((img.attrs['alt'],img.attrs['data-original']))

else:

img_list.append((img.attrs['alt'],img.attrs['src']))

image_dir = os.path.join(os.curdir,'meinv')

if not os.path.isdir(image_dir):

os.mkdir(image_dir)

for img in img_list:

name = img[0] + '.' + 'jpg'

o = urlparse(img[1])

filepath = os.path.join(image_dir,name)

url = '%s://%s/%s' % (o.scheme,o.netloc,o.path[1:].replace('_250_350',''))   #下载原图

print(url)

resp = requests.get(url)

with open(filepath,'wb') as f:

for chunk in resp.iter_content(1024):  #如果图片太大,以1024字节为单位下载

f.write(chunk)

Python 爬虫批量下载美女图片,给枯燥的工作添加点乐趣!相关推荐

  1. Python 爬虫 批量下载论坛图片

    原创文章,欢迎转载.转载请注明出处:http://blog.csdn.net/jmppok/article/details/16847697 前几天心血来潮,写了个Python程序,用来下载论坛上的图 ...

  2. python爬虫批量下载“简谱”

    python讨论qq群:996113038 导语: 上次发过一篇关于"python打造电子琴"的文章,从阅读量来看,我们公众号的粉丝里面还是有很多对音乐感兴趣的朋友的.于是,今天我 ...

  3. 【爬虫实战项目】Python爬虫批量下载音乐飙升榜并保存本地(附源码)

    前言 今天给大家介绍的是Python爬虫批量下载音乐飙升榜并保存本地,在这里给需要的小伙伴们代码,并且给出一点小心得. 首先是爬取之前应该尽可能伪装成浏览器而不被识别出来是爬虫,基本的是加请求头,但是 ...

  4. 【爬虫实战项目】Python爬虫批量下载评书音频并保存本地(附源码)

    前言 今天给大家介绍的是Python爬虫批量下载评书音频并保存本地,在这里给需要的小伙伴们代码,并且给出一点小心得. 首先是爬取之前应该尽可能伪装成浏览器而不被识别出来是爬虫,基本的是加请求头,但是这 ...

  5. 新一配:perl循环调用python爬虫批量下载喜马拉雅音频

    新一配:perl循环调用python爬虫批量下载喜马拉雅音频 手机下载喜马拉雅音频后,获得的音频文件虽然可以转成mp3格式,但其文件名却是一长串字符串,无法辨别是哪一集,网上找了各种工具,都有局限性, ...

  6. python爬虫批量下载图片

    使用python的urllib库和正则表达式爬取 学习地址(自行base64解密):aHR0cDovL3BpYy5uZXRiaWFuLmNvbQ== 网站图片,支持批量下载. (本文仅供学习交流,请勿 ...

  7. Python实用案例,Python脚本,Python实现批量下载百度图片

    往期回顾 Python实现自动监测Github项目并打开网页 Python实现文件自动归类 Python实现帮你选择双色球号码 Python实现每日更换"必应图片"为"桌 ...

  8. python 爬虫批量下载图片

    今天加班啊,苦啊!! 无聊,用python写了一个抓图片的爬虫,感觉很不错啊,哈哈 先贴上代码:(python 版本:2.7.9) __author__ = 'bloodchilde'import u ...

  9. python爬虫 批量下载高清大图

    文章目录 前言 下载免费高清大图 下载带水印的精选图 代码与总结 前言 在上一篇写文章没高质量配图?python爬虫绕过限制一键搜索下载图虫创意图片!中,我们在未登录的情况下实现了图虫创意无水印高清小 ...

最新文章

  1. mysql关于时间的面试题,mysql时间设置默认值MySQL常见面试题
  2. JAVA语言概述和基本语法知识点
  3. 验证码的编写——本质:图片目的:防止恶意表单注册
  4. TypeError: decoding Unicode is not supported
  5. Java开发经典面试题分享,建议收藏
  6. SoC嵌入式软件架构设计之二:虚拟内存管理原理、MMU硬件设计及代码分块管理...
  7. 范式化设计和反范式化设计优缺点
  8. 如何在浏览器里开发并运行 SAP UI5 应用
  9. centos 7 mysql 中文,解决centOS7 下mysql插入中文字符报错相关问题
  10. python的模块和类_Python 模块和类
  11. mysql 安装问题汇总_Windows 10 下MySQL安装及常见问题
  12. c++——const关键字
  13. AFNetworking-RequestSerializer
  14. 产品需求文档五分钟轻松搞定!这可能史上最全PRD文档模板
  15. MA、BMA、PPP网络类型实验
  16. 第一章 富爸爸,穷爸爸
  17. 那些35岁的程序员哪里去了?
  18. addActionListener
  19. Redis详细总结笔记
  20. tcpip四层源码分析(Linux)

热门文章

  1. javascript基础快速入门
  2. 微博群发私信 php,用PHP基于Redis消息队列实现发布微博的方法
  3. 使用花生棒(内网版)远程控制电脑
  4. 人生的十字路口,该往哪走?
  5. CMS系统漏洞分析溯源
  6. 墨者学院12 命令注入执行分析
  7. 雨心触动精灵VIP教程
  8. ‘nvidia’不是内部或外部命令,也不是可运行的程序或批处理文件
  9. Python 基础语法(2)
  10. 永磁同步电机无速度传感器控制(三)——模型参考自适应法(一)【估计原理】