Python爬虫----爬取妹子图片
近来无事,或许是独自无聊,便产生以下程序
我们的目的不是搞事,是合理利用资源
各位,虎躯重要,合理食用
环境:python 3.6
第三方库
requests BeautifulSoup4
推荐使用 Anaconda 集成包
以下是全部代码
#coding=utf-8
# 作者:听风
import requests
from bs4 import BeautifulSoupdef imgurl(url):res = requests.get(url)soup = BeautifulSoup(res.text, 'html.parser')# 获取总页数page = int(soup.select('.pagenavi span')[-2].text)# 获取图片链接a = soup.select('.main-image a')[0]src = a.select('img')[0].get('src')meiziid = src[-9:-6]print('开始下载妹子:',format(meiziid))for i in range(1, page+1):i = '%02d' % iimg = src.replace('01.jpg', str(i)+'.jpg')headers = {'User-Agent':'Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1)','Referer':'http://www.mzitu.com'}#此请求头破解防盗链response = requests.get(img,headers=headers)f = open('E:\\download\\meizi\\'+meiziid+'%s.jpg' % i, 'wb')f.write(response.content)f.close()print( '===> %s 完成 ' % (meiziid + i))print('妹子 %s 下载好了,请享用!\n' % meiziid)def imgpage(page=''):res = requests.get('http://www.mzitu.com/page/' + page)soup = BeautifulSoup(res.text, 'html.parser')href = soup.select('#pins a')# 链接去重list = set([i.get('href') for i in href])# 遍历下载[imgurl(i) for i in list]result = input('你要下载哪一页的妹子:')
imgpage(result)# python version : 3.6
如果程序报错,请试图用浏览器访问对应的页码,确定能访问时再运行该程序
此程序为单线程,个人不建议用使用多线程,我们是为了学习,不是搞崩人家的服务器
多线程请参考 http://blog.csdn.net/baidu_35085676/article/details/68958267
更详细的教程,看上面的链接,如果有需要,我再写
Python爬虫----爬取妹子图片相关推荐
- python爬虫,爬取下载图片
python爬虫,爬取下载图片 分别引入以下三个包 from urllib.request import urlopen from bs4 import BeautifulSoup import re ...
- Python爬虫爬取相关图片
简要的实现实现Python爬虫爬取百度贴吧页面上的图片,下面的网页就是本篇博客所要爬的网页,当然看到的只是其中的一部分图片,是所要爬取的页面, 而下图则是最终的爬取的图片: 接下来就简要的讲讲爬取的整 ...
- python爬虫爬取网页图片_Python爬虫:爬取网页图片
先分析查找要爬取图片的路径 在浏览器F12 审查元素 整体实现代码 # -- coding:UTF-8 -- import requests from bs4 import BeautifulSoup ...
- python爬虫爬取百度图片总结_python爬虫如何批量爬取百度图片
当我们想要获取百度图片的时候,面对一张张图片,一次次的点击右键下载十分麻烦.python爬虫可以实现批量下载,根据我们下载网站位置.图片位置.图片下载数量.图片下载位置等需求进行批量下载,本文演示py ...
- python爬虫爬取百度图片,python爬虫篇2:爬取百度图片
入门级 import requests import re import os from urllib import error def main(): dirPath = "E:\pyth ...
- 上手快!!福利局!新手如何使用python爬虫爬取网页图片(使用正则进行数据解析)当然这个新手是我自己
作为一个python新入门小白,突然就想发个博客,一方面为了记录学习历程,一方面能分享给新入门的同学经验,更多的是想和大家一起学习和交流.以下是我以小白的角度分享的爬虫的相关知识和一个简单的爬取网页图 ...
- 利用python爬虫爬取斗鱼图片(简单详细)
关于 在一个安静的夜晚,我缓慢的打开了电脑,望着已经睡着的父母,我轻轻的把门关上,看着斗鱼颜值主播的魅力,我不尽感叹,要是每天都可以不需要那么麻烦的去看那该有多好! 于是我想起了最近刚学的爬虫,嘴角露 ...
- Python爬虫爬取src图片
Python爬虫爬取图片 需要用到的库: os time request lxml 代码源码如下: import os import time import requests from lxml im ...
- 超详细解析python爬虫爬取京东图片
超详细图片爬虫实战 实例讲解(京东商城手机图片爬取) 1.创建一个文件夹来存放你爬取的图片 2.第一部分代码分析 3.第二部分代码分析 完整的代码如下所示: 升级版代码: 爬取过程中首先你需要观察在手 ...
最新文章
- vue+elementui搭建后台管理界面(登录)
- 提高数据中心空间使用率,助力数字新基建
- 计算机网络【wireshark抓包分析】
- android百度地图 描点,百度地图批量描点写字
- Python之令人心烦意乱的字符编码与转码
- BZOJ3527: [Zjoi2014]力 [FFT]
- java 与 区别
- 题解 CF1391A 【Suborrays】
- HDU4027 (线段树/修改区间,询问区间和)
- ER图设计数据库 练习题
- inDesign教程,如何使用 Pantone 颜色为黑白图像着色?
- 计算机专业术语英文缩写,计算机常用术语英文缩写
- 鼓励别人谈论他们自己
- 为什么全网通手机联通显示无服务器,手机卡无服务怎么回事
- 头条视频30万次播放有多少收益,今日头条一个视频收益持续多久
- 修改elementui 的datepicker日期选择器自然周从周一至周日
- android源码下载及编译
- 华为云对象存储服务OBS,海量存储安全可靠,让云存储更加简单
- 原创有关年华,无关风月
- 我的CSDN博客正式登陆
热门文章
- SYSTEM32 下的几乎所有文件的简单说明(原由无忧启动论坛老毛桃出)
- java个性签名_程序员用搞笑个性签名
- 佛山c语言培训学校,佛山C语言培训:如何轻松学习C语言?
- others_shellcode
- 西北乱跑娃 --- 持续稳定的isbn接口
- SN74LVC4245A/(74LVC245) 真是个好东西啊
- 更新丨织信Informat V1.12:审批流通知支持移动端打开链接,一键实现快速审批
- 【C#懒蛋编程——5分钟经验分享】01逆序遍历删除,防止迭代器失效
- 换了个地方,来北京工作,面试了4家python爬虫,写一些这四家(记得的)笔试题(2)
- 统计学的入世与出世观----谢邦昌