2019独角兽企业重金招聘Python工程师标准>>>

#!/usr/bin/env python
# -*- encoding:utf-8 -*-
# author :insun
#http://yxmhero1989.blog.163.com/blog/static/112157956201311994027168/
import urllib, urllib2, re, sys, os
reload(sys)#url = 'http://huaban.com/favorite/'
if(os.path.exists('beauty') == False):os.mkdir('beauty')def get_huaban_beauty():pin_id = 48145457limit = 20 #他默认允许的limit为100while pin_id != None:url = 'http://huaban.com/favorite/beauty/?max=' + str(pin_id) + '&limit=' + str(limit) + '&wfl=1'try:i_headers = {"User-Agent": "Mozilla/5.0(Windows; U; Windows NT 5.1; zh-CN; rv:1.9.1)\Gecko/20090624 Firefox/3.5", \"Referer": 'http://baidu.com/'}req = urllib2.Request(url, headers=i_headers)html = urllib2.urlopen(req).read()reg = re.compile('"pin_id":(.*?),.+?"file":{"farm":"farm1", "bucket":"hbimg",.+?"key":"(.*?)",.+?"type":"image/(.*?)"', re.S)groups = re.findall(reg, html)print str(pin_id) + "Start to catch " + str(len(groups)) + " photos"for att in groups:pin_id = att[0]att_url = att[1] + '_fw554'img_type = att[2]img_url = 'http://img.hb.aicdn.com/' + att_urlif(urllib.urlretrieve(img_url, 'beauty/' + att_url + '.' + img_type)):print img_url + '.' + img_type + ' download success!'else:print img_url + '.' + img_type + ' save failed'
#print pin_idexcept:print 'error occurs'get_huaban_beauty()

转载于:https://my.oschina.net/u/1412027/blog/195589

Python抓取花瓣网图片脚本相关推荐

  1. Python 爬虫: 抓取花瓣网图片

    接触Python也好长时间了,一直没什么机会使用,没有机会那就自己创造机会!呐,就先从爬虫开始吧,抓点美女图片下来. 废话不多说了,讲讲我是怎么做的. 1. 分析网站 想要下载图片,只要知道图片的地址 ...

  2. 小白请上车 | Python抓取花瓣网高清美图

    一:前言 嘀嘀嘀,上车请刷卡.昨天看到了不错的图片分享网-- 花瓣 ,里面的图片质量还不错,所以利用selenium+xpath我把它的妹子的栏目下爬取了下来,以图片栏目名称给文件夹命名分类保存到电脑 ...

  3. Python抓取花瓣网高清美图

    一:前言 嘀嘀嘀,上车请刷卡.昨天看到了不错的图片分享网--花瓣,里面的图片质量还不错,所以利用selenium+xpath我把它的妹子的栏目下爬取了下来,以图片栏目名称给文件夹命名分类保存到电脑中. ...

  4. python花瓣飘零_小白请上车 | Python抓取花瓣网高清美图

    一:前言 嘀嘀嘀,上车请刷卡.昨天看到了不错的图片分享网-- 花瓣 ,里面的图片质量还不错,所以利用selenium+xpath我把它的妹子的栏目下爬取了下来,以图片栏目名称给文件夹命名分类保存到电脑 ...

  5. async 异步抓取 花瓣网高清大图 30s爬取500张

    废话 不多说,直接上代码,不懂得看注释 先安装  pip install aiohttp 1 "异步抓取花瓣网图片" 2 3 # pip install aiohttp 4 imp ...

  6. python批量读取图片并批量保存_Python爬虫:批量抓取花瓣网高清美图并保存

    原标题:Python爬虫:批量抓取花瓣网高清美图并保存 昨天看到了不错的图片分享网--花瓣,里面的图片质量还不错,所以利用selenium+xpath我把它的妹子的栏目下爬取了下来,以图片栏目名称给文 ...

  7. 使用python抓取落网期刊图片

    使用python抓取落网期刊图片 虽然使用python开发也将近两年了,但工作中使用python更多处理业务逻辑,数据加工等,难免有些枯燥.乏味.一直听闻python在web数据爬取.数据分析上有无可 ...

  8. python抓取网站图片_python抓取图片示例 python抓取网页上图片

    python抓取网页上图片 这个错误时是什么意思 下面是代码 import re import urllib.request imp正则表达式匹配的url有错误 for x in add: print ...

  9. 【python】python 爬虫(python抓取网站的图片)

    文章目录 1.什么是爬虫 2.爬虫的思想 一些知识 1 . 环境的搭建请看: 2 . 3 .:Requests urllib的升级版本打包了全部功能并简化了使用方法(点我查看官方文档) 4 : bea ...

最新文章

  1. AAAI2021论文合集汇总!(持续更新)
  2. java 怎么输出地址,Java中char[]输出不是内存地址的原因详解
  3. coreos 安装 mysql_kubernetes下安装mysql
  4. 技术竞争力之Web技术方向
  5. shell编程快捷方法
  6. 联合光伏回应“天价收购”质疑:并非每瓦10.24元
  7. Linux 中安装软件报缺少共享库文件的错误
  8. 1 / 1 / 2016
  9. python 数据挖掘算法
  10. CMMI3-CMMI5认证费用及认证周期
  11. 《apue》 首次拜读完经典之作,两三记录
  12. JQuery读取txt文件
  13. Kali利用Redis未授权漏洞入侵服务器
  14. 电子海图浮标信息的计算和输入
  15. CAT-6:六类/增强六类双绞线标准
  16. 新手如何玩转拼多多?需要注意什么?
  17. 视频gif如何制作?试试这个视频制作gif神器
  18. 在线html编辑器 富文本转为html代码
  19. 防火墙技术之----包过滤(Packet Filter)
  20. 搜索功能java代码_简单的搜索框代码实现

热门文章

  1. 微擎mc.mod.php,微擎获取用户头像失败的问题如何处理
  2. STM32时钟系统(1)-时钟框图解释
  3. html文件在线合并,该如何合并多个HTML 帮助文件
  4. QT无人机地面站设计与制作随笔总结
  5. 自建CDN技术选型: squid varnish nginx
  6. 鉴源实验室丨车载ECU嵌入式设备的诊断测试 - 服务
  7. Vitamio打造万能播放器使用步骤
  8. 关于计算机的想象类作文,作文:材料作文(想象篇)
  9. Win10出现身份验证错误,要求的函数不受支持 可能是由于CredSSP加密Oracle修正。
  10. 中睿职称计算机考试模块,2012年衡阳市中睿典职称计算机Windows模块操作试题及答案.doc...