python花瓣网图片_python制作花瓣网美女图片爬虫
花瓣图片的加载使用了延迟加载的技术,源代码只能下载20多张图片,修改后基本能下载所有的了,只是速度有点慢,后面再优化下
import urllib, urllib2, re, sys, os,requests
path=r"C:\wqa\beautify"
url = 'http://huaban.com/favorite/beauty'
#http://huaban.com/explore/zhongwenlogo/?ig1un9tq&max=327773629&limit=20&wfl=1
i_headers = {"User-Agent": "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/46.0.2490.71 Safari/537.36"}
count=0
def urlHandle(url):
req = urllib2.Request(url, headers=i_headers)
html = urllib2.urlopen(req).read()
reg = re.compile(r'"pin_id":(\d+),.+?"file":{"farm":"farm1", "bucket":"hbimg",.+?"key":"(.*?)",.+?"type":"image/(.*?)"', re.S)
groups = re.findall(reg, html)
return groups
def imgHandle(groups):
if groups:
for att in groups:
pin_id = att[0]
att_url = att[1] + '_fw236'
img_type = att[2]
img_url = 'http://img.hb.aicdn.com/' + att_url
r = requests.get(img_url)
with open(path + att_url + '.' + img_type, 'wb') as fd:
for chunk in r.iter_content():
fd.write(chunk)
groups = urlHandle(url)
imgHandle(groups)
while(groups):
count+=1
print count
pin_id = groups[-1][0]
print pin_id
urltemp = url+'/?max=' + str(pin_id) + '&limit=' + str(20) + '&wfl=1'
print(urltemp)
groups = urlHandle(urltemp)
#print groups
imgHandle(groups)
本条技术文章来源于互联网,如果无意侵犯您的权益请点击此处反馈版权投诉
python花瓣网图片_python制作花瓣网美女图片爬虫相关推荐
- python播放在线音乐_Python爬取网易云音乐播放地址
本帖最后由 bbbbbd 于 2017-9-25 12:13 编辑 Python爬取网易云音乐播放地址 运行环境:Python2.7 一.分析目标网站 首先打开网易云音乐的官网,在搜索列表中随便搜索一 ...
- python 批量下载网页图片_Python实现多线程批量下载图片
<派森>(Python)3.13 win32 英文安装版 类型:编程工具大小:21M语言:英文 评分:8.7 标签: 立即下载 爬取图片可真的是一个可遇不可求的机会. 有需求就会动力. 目 ...
- 用python画apc图_Python开发GUI实战:图片转换素描画工具!
奋斗没有终点好好学习72变,因为将来 没有人能替你阻挡81难 . 生如蝼蚁,当有鸿鹄之志: 命如纸薄,应有不屈之心 . ! 今天被这句话触动了,所以开篇分享给大家.鸡汤有毒,但有时大家却靠它激励自己继 ...
- python pdf处理 图片_python PDF文件合并、图片处理
一.合并多个PDF文件 实例: #导入模块import codecs import os import PyPDF2 as PyPDF2 #建立一个装pdf文件的数组 files = list()#遍 ...
- 如何使用python批量压缩图片_python利用Guetzli批量压缩图片
Google 又开源了,这次开源了一款图像算法工具 Guetzli.Guetzli,在瑞士德语中是"cookie(曲奇)"的意思,是一个针对数码图像和网页图像的 JPEG 编码器, ...
- python自动换壁纸_Python爬取必应每日图片并实现Windows壁纸自动切换
不知道大家是否对每日一成不变的壁纸感到厌倦呢?反正对于我个人来说,如果每天打开电脑映入眼帘的都是不同的画面,那么科研热情都会被充分激发,从而提高自己的劳动生产力. 原来使用的是Deepin系统,自己写 ...
- python识别图片中方框_Python+Opencv实现鼠标在图片上取色
1.实现效果: 左边是Python代码的运行界面.可以看到在输出行有[249 221 187]三个数字,因为我在右侧的图片上点击了某个区域,因此就输出了所点击区域的RGB颜色.RGB颜色就是三原色,三 ...
- python抓包代码_Python抓包并解析json爬虫的完整实例代码
Python抓包并解析json爬虫FwA免费资源网 在使用Python爬虫的时候,通过抓包url,打开url可能会遇见以下类似网址,打开后会出现类似这样的界面,无法继续进行爬虫:FwA免费资源网 Fw ...
- PNG图片怎么制作gif动画?图片gif动画制作方法
png格式的静态图片想要做成gif动画图片时,要怎么操作呢?给大家分享一款操作简单的在线动图生成工具-[GIF中文网]的gif制作(https://www.gif.cn/)功能,上传两张及以上的png ...
- Python用10行代码爬取大批美女图片
说到美女,第一个想到的就是美女云集的相亲网站了.所以今天也是选取某个相亲网站作为素材,爬取美女图片. 1.准备工作 首先需要一个相亲网站的账号,我这里选取的是"我主良缘".注册登陆 ...
最新文章
- 让Centos5.6的Firefox支持Java
- linux日志生成速率统计,Linux学习29-awk提取log日志信息,统计日志里面ip访问次数排序...
- python3 导入上级目录中的模块
- 数据处理——One-Hot Encoding
- RabbitMQ 一二事(4) - 路由模式介绍
- ajax请求后台表格数据,商品后台表格数据的展现方式
- 古典概型中的几何体计数
- day44-前端知识之HTML内容
- vue cli3.0 解决跨域问题和axios等问题,配合Django
- 超全地牢场景unity3d模型素材网站整理
- 读书笔记 - 说话之道 - 2
- Java基础之《netty(28)—TCP粘包拆包原理》
- 8人Python-----day04
- 排列组合问题 “n个球放入m个盒子(8种)”
- 创业好,还是上班好?你觉得呢
- IE8常见问题及解决方法
- 2020最新C#顺丰丰桥平台下单接口
- 三种样式的九九乘法表—C语言
- Linux下的QQ客户端EVA初试以及ibus输入法问题的解决方法
- 老鼠试药——二进制算法
热门文章
- 英文站变现赚美金的7种方式
- 使用VC2005编译静态应用程序的方法
- 一些不为人知的秘密[迅雷和快播]
- 时速云CEO:相对于IaaS和PaaS,未来CaaS将如何定位?
- 华为手机怎么使用读卡器_华为G7手机OTG功能详细使用教程
- HTML5期末大作业:游戏网站设计与实现——基于bootstrap响应式游戏资讯网站制作HTML+CSS+JavaScript
- 华为数通 软开 2022校招 面试全过 已开奖
- 描述性统计分析案例题_SPSS问卷数据统计分析之项目分析
- 拼多多API接口:item_search - 根据关键词取商品列表
- cisco2811 一对一IP地址映射