python爬取校花网的图片
import re
import os.path
import requests
import hashlib
import timerespose=requests.get('http://www.xiaohuar.com/hua/')
print(respose.status_code)# 响应的状态码
# print(respose.content) #返回字节信息
# print(respose.text) #返回文本内容
urls=re.findall(r'class="item masonry_brick".*?src="(.*?)"',respose.text,re.S) #re.S 把文本信息转换成1行匹配
print(urls)for url in urls:if not url.startswith('http'):url='http://www.xiaohuar.com%s' %urlimg = requests.get(url)if img.status_code==200:m=hashlib.md5()m.update(url.encode('utf-8'))m.update(str(time.time()).encode('utf-8'))# 后缀名ext = os.path.splitext(url)[1]filename=r"%s%s"% (m.hexdigest(),ext)filepath=r'F:\\xiaocao/%s'%filenameprint(filepath)with open(filepath, 'wb') as f:f.write(img.content)
python爬取校花网的图片相关推荐
- Python爬取校花网,妈妈再也不会担心我不给她发女朋友照片了
本文同步发表于我的微信公众号,扫一扫文章底部的二维码或在微信搜索 极客导航 即可关注,每个工作日都有文章更新. 一.概况 上一篇我们用一个表情网站入门了爬虫,爬了很多表情.今天我们继续在爬的路上,今天 ...
- Python爬虫框架 scrapy 入门经典project 爬取校花网资源、批量下载图片
####1.安装scrapy 建议:最好在新的虚拟环境里面安装scrapy 注意:博主是在 Ubuntu18.04 + Python3.6 环境下进行开发的,如果遇到安装scrapy不成功请自行百度/ ...
- Python爬虫:正则表达式爬取校花网
#正则表达式爬取校花网 # 网址 url = 'http://www.xiaohuar.com' #分页爬取大学校花图片共16页640张美图 1.导入模块 import requests import ...
- 使用Xpath爬取校花网,致敬10年前的校花『和』我们逝去的青春
使用xpath爬取校花网 难点: 1.各个分类栏目下的页码url不统一 2.只取前三页,或者后三页 文章代码仅使用xpath和requests,本来想用scrapy框架的,但是偷了个懒. 所以就-哈哈 ...
- scrapy 爬取校花网
原文链接: scrapy 爬取校花网 上一篇: scrapy 安装和简单命令 下一篇: scrapy 腾讯 招聘信息爬取 网址,爬取名称和对应的图片链接,并保存为json格式 http://www.x ...
- 使用python爬取斗图网的图片
使用python爬取斗图网的图片 以下是代码部分: # -*- coding: utf-8 -*- """ Created on Wed Apr 14 14:41:42 ...
- python爬取捧腹网gif图片
#_*_coding:utf-8_*_ #爬取捧腹网GIF图片 import urllib,re import urllib.request import chardet #需要导入这个模块,检测编码 ...
- pycharm 爬取校花网
1 1:什么是爬虫 2 定义:狭义:模拟浏览器,浏览网页,保存数据的程序 3 定义:广义:自动下载网络数据(网页,游戏,qq)的程序 4 打开校花网 'www.xiaohuar.com/hua/' # ...
- div不占位置_Python爬取校花网,妈妈再也不会担心我不给她发女朋友照片了
一.概况 上一篇我们用一个表情网站入门了爬虫,爬了很多表情.今天我们继续在爬的路上,今天就爬个校花吧,毕竟妹子属于稀缺资源,要不妈妈总会问,你到底找不找女朋友了,爬点校花吧,以后跟妈妈聊天,可以哭着对 ...
最新文章
- 贪心,POJ(2709)
- 普通类可以抛出异常吗
- 如何在自己的博客中搜索
- 入门云虚拟主机,为你的业务快速实现数据备份和数据恢复
- 计算机应用基础教程2015答案,《计算机应用基础教程(2015版)》_课后题答案.doc
- 学英语(4)---出门在外常用的英语句子
- Gmail邮件客户端pop3和smtp服务器配置
- neo4j笔记(一)
- 网课答案题库系统 内含接口使用
- js中exec()函数的使用
- Writing a code for speed tracking control of maglev trains in MATLAB using reinforcement learning
- 博通wifi 芯片配置工具wl 详解
- css中文本指什么,CSS中的文本属性学习指南
- 【文本三剑客之一sed】
- 10大硬盘数据恢复软件推荐
- 安卓毕设项目总结(二)校园订餐app
- Django 2.1.7 MVT模型示例 - 查询数据,返回渲染模板数据
- 心态-《自卑与超越》书中的精髓:我们为什么会感到自卑,以及如何做才能克服自卑情绪。
- 2011年上半年总结-虚惊
- git 放弃本地操作,直接更新拉取远程最新代码