Requests 校花网图片爬取
纪念我们闹过的矛盾,只想平淡如水 import requestsimport reurl = 'http://www.xiaohuar.com/list-1-%s.html'for i in range(4): temp = url % i response =requests.get(temp) html = response.text #img_urls=re.findall(r"/d/file/\d+/\w+\.jpg",html)#取出图片URL #img_urls1 = re.findall(r"https://\w+.*?/\w+/\w+/\w+/\w+/\d+/\w+.*\.jpg", html)#取出图片URL #img_names = re.findall(r'<img \w+.*="\d+".*? alt="(.*?)"', html) #取出图片名称 img=re.findall(r'<img \w+.*="\d+".*? alt="(.*?)".*"(/d/file/\d+/\w+\.jpg)"', html) for img_tupian in img: img_tupian_urls=img_tupian[-1]#取出图片Url img_name=img_tupian[0]#取出名称 img_response=requests.get("http://www.xiaohuar.com%s" %img_tupian_urls)
xiaohua=img_response.content name=("http://www.xiaohuar.com%s" %img_tupian_urls).split('/')[-1] print(houzui) with open(img_name +name,'wb') as f: f.write(xiaohua)
爬取结果还是有点不好看,有空想想把那些乱码去掉
转载于:https://www.cnblogs.com/python2687806834/p/9687108.html
Requests 校花网图片爬取相关推荐
- python爬图片_Python爬虫:彼岸图网图片爬取-Go语言中文社区
杂 哈哈,这是我第一篇博客 半年以后回来再看发现这代码简直太难看了 现在已经弃用大小驼峰转蛇形命名了 确实好看 除了命名别的也写的不怎么样 因为爬虫只是个爱好所以也不准备再投入时间重构了 将就着看吧 ...
- Python爬虫:彼岸图网图片爬取
杂 哈哈,这是我第一篇博客 半年以后回来再看发现这代码简直太难看了 现在已经弃用大小驼峰转蛇形命名了 确实好看 除了命名别的也写的不怎么样 因为爬虫只是个爱好所以也不准备再投入时间重构了 将就着看吧 ...
- 初识scrapy,美空网图片爬取实战
这俩天研究了下scrapy爬虫框架,遂准备写个爬虫练练手.平时做的较多的事情是浏览图片,对,没错,就是那种艺术照,我骄傲的认为,多看美照一定能提高审美,并且成为一个优雅的程序员.O(∩_∩)O~ 开个 ...
- python爬虫之反爬虫情况下的煎蛋网图片爬取初步探索
本次爬虫网址:http://jandan.net/ooxx 前言: 前段时间一直在折腾基于qqbot的QQ机器人,昨天用itchat在微信上也写了一个机器人,相比webqq,微信的web端功能比较丰富 ...
- 「Python爬虫系列讲解」十二、基于图片爬取的 Selenium 爬虫
本专栏是以杨秀璋老师爬虫著作<Python网络数据爬取及分析「从入门到精通」>为主线.个人学习理解为主要内容,以学习笔记形式编写的. 本专栏不光是自己的一个学习分享,也希望能给您普及一些关 ...
- Python爬虫框架 scrapy 入门经典project 爬取校花网资源、批量下载图片
####1.安装scrapy 建议:最好在新的虚拟环境里面安装scrapy 注意:博主是在 Ubuntu18.04 + Python3.6 环境下进行开发的,如果遇到安装scrapy不成功请自行百度/ ...
- 使用Xpath爬取校花网,致敬10年前的校花『和』我们逝去的青春
使用xpath爬取校花网 难点: 1.各个分类栏目下的页码url不统一 2.只取前三页,或者后三页 文章代码仅使用xpath和requests,本来想用scrapy框架的,但是偷了个懒. 所以就-哈哈 ...
- Python爬虫:正则表达式爬取校花网
#正则表达式爬取校花网 # 网址 url = 'http://www.xiaohuar.com' #分页爬取大学校花图片共16页640张美图 1.导入模块 import requests import ...
- Python爬取校花网,妈妈再也不会担心我不给她发女朋友照片了
本文同步发表于我的微信公众号,扫一扫文章底部的二维码或在微信搜索 极客导航 即可关注,每个工作日都有文章更新. 一.概况 上一篇我们用一个表情网站入门了爬虫,爬了很多表情.今天我们继续在爬的路上,今天 ...
- div不占位置_Python爬取校花网,妈妈再也不会担心我不给她发女朋友照片了
一.概况 上一篇我们用一个表情网站入门了爬虫,爬了很多表情.今天我们继续在爬的路上,今天就爬个校花吧,毕竟妹子属于稀缺资源,要不妈妈总会问,你到底找不找女朋友了,爬点校花吧,以后跟妈妈聊天,可以哭着对 ...
最新文章
- CentOS 7 安装Boost 1.67及boost_python
- RabbitMQ OS X下安装及常用命令-1
- Android之linux基础教学之八 内核同步介绍
- Java 使用枚举类的实例
- 服务器需要指定dns吗,Windows Server2012 安装配置DNS服务器方法详解
- ae效果英文版翻译对照表_AE CS6 最全特效中英翻译
- 阿里面试算法题(一)
- Java那些不为人知的技巧
- P、NP、NPC问题
- CH340刷新OLED12864
- 用计算机怎么打出X,电脑键盘x号怎么打出来
- 支付宝17年新春红包技术体系剖析
- 最新 eCharts 世界地图国家名映射
- neovim安装 vim-plug插件管理器安装
- 王家林老师人工智能AI 第26课:使用Apriori对美食店的消费者进行美食推荐 老师微信13928463918
- liferay中的社区(Communities)概念
- 2020年Web前端面试题及答案----ES6篇
- 分享一些写博客的实用工具
- 微信小程序一双日记-项目分享
- jmeter基础操作,图文