花瓣图片的加载使用了延迟加载的技术,源代码只能下载20多张图片,修改后基本能下载所有的了,只是速度有点慢,后面再优化下

import urllib, urllib2, re, sys, os,requests

path=r"C:\wqa\beautify"

url = 'http://huaban.com/favorite/beauty'

#http://huaban.com/explore/zhongwenlogo/?ig1un9tq&max=327773629&limit=20&wfl=1

i_headers = {"User-Agent": "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/46.0.2490.71 Safari/537.36"}

count=0

def urlHandle(url):

req = urllib2.Request(url, headers=i_headers)

html = urllib2.urlopen(req).read()

reg = re.compile(r'"pin_id":(\d+),.+?"file":{"farm":"farm1", "bucket":"hbimg",.+?"key":"(.*?)",.+?"type":"image/(.*?)"', re.S)

groups = re.findall(reg, html)

return groups

def imgHandle(groups):

if groups:

for att in groups:

pin_id = att[0]

att_url = att[1] + '_fw236'

img_type = att[2]

img_url = 'http://img.hb.aicdn.com/' + att_url

r = requests.get(img_url)

with open(path + att_url + '.' + img_type, 'wb') as fd:

for chunk in r.iter_content():

fd.write(chunk)

groups = urlHandle(url)

imgHandle(groups)

while(groups):

count+=1

print count

pin_id = groups[-1][0]

print pin_id

urltemp = url+'/?max=' + str(pin_id) + '&limit=' + str(20) + '&wfl=1'

print(urltemp)

groups = urlHandle(urltemp)

#print groups

imgHandle(groups)

本条技术文章来源于互联网,如果无意侵犯您的权益请点击此处反馈版权投诉

python花瓣网图片_python制作花瓣网美女图片爬虫相关推荐

  1. python播放在线音乐_Python爬取网易云音乐播放地址

    本帖最后由 bbbbbd 于 2017-9-25 12:13 编辑 Python爬取网易云音乐播放地址 运行环境:Python2.7 一.分析目标网站 首先打开网易云音乐的官网,在搜索列表中随便搜索一 ...

  2. python 批量下载网页图片_Python实现多线程批量下载图片

    <派森>(Python)3.13 win32 英文安装版 类型:编程工具大小:21M语言:英文 评分:8.7 标签: 立即下载 爬取图片可真的是一个可遇不可求的机会. 有需求就会动力. 目 ...

  3. 用python画apc图_Python开发GUI实战:图片转换素描画工具!

    奋斗没有终点好好学习72变,因为将来 没有人能替你阻挡81难 . 生如蝼蚁,当有鸿鹄之志: 命如纸薄,应有不屈之心 . ! 今天被这句话触动了,所以开篇分享给大家.鸡汤有毒,但有时大家却靠它激励自己继 ...

  4. python pdf处理 图片_python PDF文件合并、图片处理

    一.合并多个PDF文件 实例: #导入模块import codecs import os import PyPDF2 as PyPDF2 #建立一个装pdf文件的数组 files = list()#遍 ...

  5. 如何使用python批量压缩图片_python利用Guetzli批量压缩图片

    Google 又开源了,这次开源了一款图像算法工具 Guetzli.Guetzli,在瑞士德语中是"cookie(曲奇)"的意思,是一个针对数码图像和网页图像的 JPEG 编码器, ...

  6. python自动换壁纸_Python爬取必应每日图片并实现Windows壁纸自动切换

    不知道大家是否对每日一成不变的壁纸感到厌倦呢?反正对于我个人来说,如果每天打开电脑映入眼帘的都是不同的画面,那么科研热情都会被充分激发,从而提高自己的劳动生产力. 原来使用的是Deepin系统,自己写 ...

  7. python识别图片中方框_Python+Opencv实现鼠标在图片上取色

    1.实现效果: 左边是Python代码的运行界面.可以看到在输出行有[249 221 187]三个数字,因为我在右侧的图片上点击了某个区域,因此就输出了所点击区域的RGB颜色.RGB颜色就是三原色,三 ...

  8. python抓包代码_Python抓包并解析json爬虫的完整实例代码

    Python抓包并解析json爬虫FwA免费资源网 在使用Python爬虫的时候,通过抓包url,打开url可能会遇见以下类似网址,打开后会出现类似这样的界面,无法继续进行爬虫:FwA免费资源网 Fw ...

  9. PNG图片怎么制作gif动画?图片gif动画制作方法

    png格式的静态图片想要做成gif动画图片时,要怎么操作呢?给大家分享一款操作简单的在线动图生成工具-[GIF中文网]的gif制作(https://www.gif.cn/)功能,上传两张及以上的png ...

  10. Python用10行代码爬取大批美女图片

    说到美女,第一个想到的就是美女云集的相亲网站了.所以今天也是选取某个相亲网站作为素材,爬取美女图片. 1.准备工作 首先需要一个相亲网站的账号,我这里选取的是"我主良缘".注册登陆 ...

最新文章

  1. 让Centos5.6的Firefox支持Java
  2. linux日志生成速率统计,Linux学习29-awk提取log日志信息,统计日志里面ip访问次数排序...
  3. python3 导入上级目录中的模块
  4. 数据处理——One-Hot Encoding
  5. RabbitMQ 一二事(4) - 路由模式介绍
  6. ajax请求后台表格数据,商品后台表格数据的展现方式
  7. 古典概型中的几何体计数
  8. day44-前端知识之HTML内容
  9. vue cli3.0 解决跨域问题和axios等问题,配合Django
  10. 超全地牢场景unity3d模型素材网站整理
  11. 读书笔记 - 说话之道 - 2
  12. Java基础之《netty(28)—TCP粘包拆包原理》
  13. 8人Python-----day04
  14. 排列组合问题 “n个球放入m个盒子(8种)”
  15. 创业好,还是上班好?你觉得呢
  16. IE8常见问题及解决方法
  17. 2020最新C#顺丰丰桥平台下单接口
  18. 三种样式的九九乘法表—C语言
  19. Linux下的QQ客户端EVA初试以及ibus输入法问题的解决方法
  20. 老鼠试药——二进制算法

热门文章

  1. 英文站变现赚美金的7种方式
  2. 使用VC2005编译静态应用程序的方法
  3. 一些不为人知的秘密[迅雷和快播]
  4. 时速云CEO:相对于IaaS和PaaS,未来CaaS将如何定位?
  5. 华为手机怎么使用读卡器_华为G7手机OTG功能详细使用教程
  6. HTML5期末大作业:游戏网站设计与实现——基于bootstrap响应式游戏资讯网站制作HTML+CSS+JavaScript
  7. 华为数通 软开 2022校招 面试全过 已开奖
  8. 描述性统计分析案例题_SPSS问卷数据统计分析之项目分析
  9. 拼多多API接口:item_search - 根据关键词取商品列表
  10. cisco2811 一对一IP地址映射