import re
import os.path
import requests
import hashlib
import timerespose=requests.get('http://www.xiaohuar.com/hua/')
print(respose.status_code)# 响应的状态码
# print(respose.content)  #返回字节信息
# print(respose.text)  #返回文本内容
urls=re.findall(r'class="item masonry_brick".*?src="(.*?)"',respose.text,re.S)  #re.S 把文本信息转换成1行匹配
print(urls)for url in urls:if not url.startswith('http'):url='http://www.xiaohuar.com%s' %urlimg = requests.get(url)if img.status_code==200:m=hashlib.md5()m.update(url.encode('utf-8'))m.update(str(time.time()).encode('utf-8'))# 后缀名ext = os.path.splitext(url)[1]filename=r"%s%s"% (m.hexdigest(),ext)filepath=r'F:\\xiaocao/%s'%filenameprint(filepath)with open(filepath, 'wb') as f:f.write(img.content)

python爬取校花网的图片相关推荐

  1. Python爬取校花网,妈妈再也不会担心我不给她发女朋友照片了

    本文同步发表于我的微信公众号,扫一扫文章底部的二维码或在微信搜索 极客导航 即可关注,每个工作日都有文章更新. 一.概况 上一篇我们用一个表情网站入门了爬虫,爬了很多表情.今天我们继续在爬的路上,今天 ...

  2. Python爬虫框架 scrapy 入门经典project 爬取校花网资源、批量下载图片

    ####1.安装scrapy 建议:最好在新的虚拟环境里面安装scrapy 注意:博主是在 Ubuntu18.04 + Python3.6 环境下进行开发的,如果遇到安装scrapy不成功请自行百度/ ...

  3. Python爬虫:正则表达式爬取校花网

    #正则表达式爬取校花网 # 网址 url = 'http://www.xiaohuar.com' #分页爬取大学校花图片共16页640张美图 1.导入模块 import requests import ...

  4. 使用Xpath爬取校花网,致敬10年前的校花『和』我们逝去的青春

    使用xpath爬取校花网 难点: 1.各个分类栏目下的页码url不统一 2.只取前三页,或者后三页 文章代码仅使用xpath和requests,本来想用scrapy框架的,但是偷了个懒. 所以就-哈哈 ...

  5. scrapy 爬取校花网

    原文链接: scrapy 爬取校花网 上一篇: scrapy 安装和简单命令 下一篇: scrapy 腾讯 招聘信息爬取 网址,爬取名称和对应的图片链接,并保存为json格式 http://www.x ...

  6. 使用python爬取斗图网的图片

    使用python爬取斗图网的图片 以下是代码部分: # -*- coding: utf-8 -*- """ Created on Wed Apr 14 14:41:42 ...

  7. python爬取捧腹网gif图片

    #_*_coding:utf-8_*_ #爬取捧腹网GIF图片 import urllib,re import urllib.request import chardet #需要导入这个模块,检测编码 ...

  8. pycharm 爬取校花网

    1 1:什么是爬虫 2 定义:狭义:模拟浏览器,浏览网页,保存数据的程序 3 定义:广义:自动下载网络数据(网页,游戏,qq)的程序 4 打开校花网 'www.xiaohuar.com/hua/' # ...

  9. div不占位置_Python爬取校花网,妈妈再也不会担心我不给她发女朋友照片了

    一.概况 上一篇我们用一个表情网站入门了爬虫,爬了很多表情.今天我们继续在爬的路上,今天就爬个校花吧,毕竟妹子属于稀缺资源,要不妈妈总会问,你到底找不找女朋友了,爬点校花吧,以后跟妈妈聊天,可以哭着对 ...

最新文章

  1. 贪心,POJ(2709)
  2. 普通类可以抛出异常吗
  3. 如何在自己的博客中搜索
  4. 入门云虚拟主机,为你的业务快速实现数据备份和数据恢复
  5. 计算机应用基础教程2015答案,《计算机应用基础教程(2015版)》_课后题答案.doc
  6. 学英语(4)---出门在外常用的英语句子
  7. Gmail邮件客户端pop3和smtp服务器配置
  8. neo4j笔记(一)
  9. 网课答案题库系统 内含接口使用
  10. js中exec()函数的使用
  11. Writing a code for speed tracking control of maglev trains in MATLAB using reinforcement learning
  12. 博通wifi 芯片配置工具wl 详解
  13. css中文本指什么,CSS中的文本属性学习指南
  14. 【文本三剑客之一sed】
  15. 10大硬盘数据恢复软件推荐
  16. 安卓毕设项目总结(二)校园订餐app
  17. Django 2.1.7 MVT模型示例 - 查询数据,返回渲染模板数据
  18. 心态-《自卑与超越》书中的精髓:我们为什么会感到自卑,以及如何做才能克服自卑情绪。
  19. 2011年上半年总结-虚惊
  20. git 放弃本地操作,直接更新拉取远程最新代码

热门文章

  1. 【前端单元测试入门03】Sinon
  2. 根据 Excel 中的数据批量修改文件的扩展名
  3. redis maser-salve
  4. SpringCloud2020学习笔记13——SpringCloud Stream消息驱动
  5. mysql 查询最多的_MySQL中用通用查询日志找出查询次数最多的语句的教程
  6. java翻译程序_有没有java代码翻译软件?
  7. POJ - 3264
  8. 哪个CMS建站系统更利于seo优化
  9. Wireshark入门与进阶系列(二)
  10. 将正负值分别显示的函数