Python 爬虫批量下载美女图片,给枯燥的工作添加点乐趣!
背景:
最近部门领导交给笔者一个爬取百度关键词排名的任务。写好了基本功能,能不能正常使用呢?于是乎,有了本文,爬取一些美女图片,一来可以检验下爬虫效果;二来呢,也可以养养眼,给工作增加点乐趣不是,哈哈。废话少说,这就是要抓取的图片了,很养眼吧。直接上代码 地址:http://www.win4000.com/meitu.html
环境:(请读者自行配置)
Python3
urllib3
BeautifulSoup
requests
请读者自行查看审查元素,以确定抓取目标,完全生搬硬套,可能出问题
源代码:
download_meinv.py
import os
from urllib.parse import urlparse #应该是urllib3模块带来的,如果不是的话,之后在使用的过程在根据报错信息进行解决吧
from bs4 import BeautifulSoup
import requests
'''导入模块时先导入系统库,在导入第三方库'''
'''爬取美女网站首页的所有照片'''
r = requests.get('http://www.win4000.com/meitu.html')
soup = BeautifulSoup(r.text,'html.parser')
img_list = []
for img in soup.select('img'):
if img.has_attr('alt'):
if img.has_attr('data-original'):
img_list.append((img.attrs['alt'],img.attrs['data-original']))
else:
img_list.append((img.attrs['alt'],img.attrs['src']))
image_dir = os.path.join(os.curdir,'meinv')
if not os.path.isdir(image_dir):
os.mkdir(image_dir)
for img in img_list:
name = img[0] + '.' + 'jpg'
o = urlparse(img[1])
filepath = os.path.join(image_dir,name)
url = '%s://%s/%s' % (o.scheme,o.netloc,o.path[1:].replace('_250_350','')) #下载原图
print(url)
resp = requests.get(url)
with open(filepath,'wb') as f:
for chunk in resp.iter_content(1024): #如果图片太大,以1024字节为单位下载
f.write(chunk)
Python 爬虫批量下载美女图片,给枯燥的工作添加点乐趣!相关推荐
- Python 爬虫 批量下载论坛图片
原创文章,欢迎转载.转载请注明出处:http://blog.csdn.net/jmppok/article/details/16847697 前几天心血来潮,写了个Python程序,用来下载论坛上的图 ...
- python爬虫批量下载“简谱”
python讨论qq群:996113038 导语: 上次发过一篇关于"python打造电子琴"的文章,从阅读量来看,我们公众号的粉丝里面还是有很多对音乐感兴趣的朋友的.于是,今天我 ...
- 【爬虫实战项目】Python爬虫批量下载音乐飙升榜并保存本地(附源码)
前言 今天给大家介绍的是Python爬虫批量下载音乐飙升榜并保存本地,在这里给需要的小伙伴们代码,并且给出一点小心得. 首先是爬取之前应该尽可能伪装成浏览器而不被识别出来是爬虫,基本的是加请求头,但是 ...
- 【爬虫实战项目】Python爬虫批量下载评书音频并保存本地(附源码)
前言 今天给大家介绍的是Python爬虫批量下载评书音频并保存本地,在这里给需要的小伙伴们代码,并且给出一点小心得. 首先是爬取之前应该尽可能伪装成浏览器而不被识别出来是爬虫,基本的是加请求头,但是这 ...
- 新一配:perl循环调用python爬虫批量下载喜马拉雅音频
新一配:perl循环调用python爬虫批量下载喜马拉雅音频 手机下载喜马拉雅音频后,获得的音频文件虽然可以转成mp3格式,但其文件名却是一长串字符串,无法辨别是哪一集,网上找了各种工具,都有局限性, ...
- python爬虫批量下载图片
使用python的urllib库和正则表达式爬取 学习地址(自行base64解密):aHR0cDovL3BpYy5uZXRiaWFuLmNvbQ== 网站图片,支持批量下载. (本文仅供学习交流,请勿 ...
- Python实用案例,Python脚本,Python实现批量下载百度图片
往期回顾 Python实现自动监测Github项目并打开网页 Python实现文件自动归类 Python实现帮你选择双色球号码 Python实现每日更换"必应图片"为"桌 ...
- python 爬虫批量下载图片
今天加班啊,苦啊!! 无聊,用python写了一个抓图片的爬虫,感觉很不错啊,哈哈 先贴上代码:(python 版本:2.7.9) __author__ = 'bloodchilde'import u ...
- python爬虫 批量下载高清大图
文章目录 前言 下载免费高清大图 下载带水印的精选图 代码与总结 前言 在上一篇写文章没高质量配图?python爬虫绕过限制一键搜索下载图虫创意图片!中,我们在未登录的情况下实现了图虫创意无水印高清小 ...
最新文章
- mysql关于时间的面试题,mysql时间设置默认值MySQL常见面试题
- JAVA语言概述和基本语法知识点
- 验证码的编写——本质:图片目的:防止恶意表单注册
- TypeError: decoding Unicode is not supported
- Java开发经典面试题分享,建议收藏
- SoC嵌入式软件架构设计之二:虚拟内存管理原理、MMU硬件设计及代码分块管理...
- 范式化设计和反范式化设计优缺点
- 如何在浏览器里开发并运行 SAP UI5 应用
- centos 7 mysql 中文,解决centOS7 下mysql插入中文字符报错相关问题
- python的模块和类_Python 模块和类
- mysql 安装问题汇总_Windows 10 下MySQL安装及常见问题
- c++——const关键字
- AFNetworking-RequestSerializer
- 产品需求文档五分钟轻松搞定!这可能史上最全PRD文档模板
- MA、BMA、PPP网络类型实验
- 第一章 富爸爸,穷爸爸
- 那些35岁的程序员哪里去了?
- addActionListener
- Redis详细总结笔记
- tcpip四层源码分析(Linux)