纪念我们闹过的矛盾,只想平淡如水

import requestsimport reurl = 'http://www.xiaohuar.com/list-1-%s.html'for i in range(4):    temp = url % i    response =requests.get(temp)    html = response.text

    #img_urls=re.findall(r"/d/file/\d+/\w+\.jpg",html)#取出图片URL    #img_urls1 = re.findall(r"https://\w+.*?/\w+/\w+/\w+/\w+/\d+/\w+.*\.jpg", html)#取出图片URL    #img_names = re.findall(r'<img \w+.*="\d+".*? alt="(.*?)"', html) #取出图片名称    img=re.findall(r'<img \w+.*="\d+".*? alt="(.*?)".*"(/d/file/\d+/\w+\.jpg)"', html)    for img_tupian in img:        img_tupian_urls=img_tupian[-1]#取出图片Url        img_name=img_tupian[0]#取出名称

        img_response=requests.get("http://www.xiaohuar.com%s" %img_tupian_urls)
        xiaohua=img_response.content        name=("http://www.xiaohuar.com%s" %img_tupian_urls).split('/')[-1]        print(houzui)        with open(img_name +name,'wb') as f:            f.write(xiaohua)

爬取结果还是有点不好看,有空想想把那些乱码去掉       

转载于:https://www.cnblogs.com/python2687806834/p/9687108.html

Requests 校花网图片爬取相关推荐

  1. python爬图片_Python爬虫:彼岸图网图片爬取-Go语言中文社区

    杂 哈哈,这是我第一篇博客 半年以后回来再看发现这代码简直太难看了 现在已经弃用大小驼峰转蛇形命名了 确实好看 除了命名别的也写的不怎么样 因为爬虫只是个爱好所以也不准备再投入时间重构了 将就着看吧 ...

  2. Python爬虫:彼岸图网图片爬取

    杂 哈哈,这是我第一篇博客 半年以后回来再看发现这代码简直太难看了 现在已经弃用大小驼峰转蛇形命名了 确实好看 除了命名别的也写的不怎么样 因为爬虫只是个爱好所以也不准备再投入时间重构了 将就着看吧 ...

  3. 初识scrapy,美空网图片爬取实战

    这俩天研究了下scrapy爬虫框架,遂准备写个爬虫练练手.平时做的较多的事情是浏览图片,对,没错,就是那种艺术照,我骄傲的认为,多看美照一定能提高审美,并且成为一个优雅的程序员.O(∩_∩)O~ 开个 ...

  4. python爬虫之反爬虫情况下的煎蛋网图片爬取初步探索

    本次爬虫网址:http://jandan.net/ooxx 前言: 前段时间一直在折腾基于qqbot的QQ机器人,昨天用itchat在微信上也写了一个机器人,相比webqq,微信的web端功能比较丰富 ...

  5. 「Python爬虫系列讲解」十二、基于图片爬取的 Selenium 爬虫

    本专栏是以杨秀璋老师爬虫著作<Python网络数据爬取及分析「从入门到精通」>为主线.个人学习理解为主要内容,以学习笔记形式编写的. 本专栏不光是自己的一个学习分享,也希望能给您普及一些关 ...

  6. Python爬虫框架 scrapy 入门经典project 爬取校花网资源、批量下载图片

    ####1.安装scrapy 建议:最好在新的虚拟环境里面安装scrapy 注意:博主是在 Ubuntu18.04 + Python3.6 环境下进行开发的,如果遇到安装scrapy不成功请自行百度/ ...

  7. 使用Xpath爬取校花网,致敬10年前的校花『和』我们逝去的青春

    使用xpath爬取校花网 难点: 1.各个分类栏目下的页码url不统一 2.只取前三页,或者后三页 文章代码仅使用xpath和requests,本来想用scrapy框架的,但是偷了个懒. 所以就-哈哈 ...

  8. Python爬虫:正则表达式爬取校花网

    #正则表达式爬取校花网 # 网址 url = 'http://www.xiaohuar.com' #分页爬取大学校花图片共16页640张美图 1.导入模块 import requests import ...

  9. Python爬取校花网,妈妈再也不会担心我不给她发女朋友照片了

    本文同步发表于我的微信公众号,扫一扫文章底部的二维码或在微信搜索 极客导航 即可关注,每个工作日都有文章更新. 一.概况 上一篇我们用一个表情网站入门了爬虫,爬了很多表情.今天我们继续在爬的路上,今天 ...

  10. div不占位置_Python爬取校花网,妈妈再也不会担心我不给她发女朋友照片了

    一.概况 上一篇我们用一个表情网站入门了爬虫,爬了很多表情.今天我们继续在爬的路上,今天就爬个校花吧,毕竟妹子属于稀缺资源,要不妈妈总会问,你到底找不找女朋友了,爬点校花吧,以后跟妈妈聊天,可以哭着对 ...

最新文章

  1. CentOS 7 安装Boost 1.67及boost_python
  2. RabbitMQ OS X下安装及常用命令-1
  3. Android之linux基础教学之八 内核同步介绍
  4. Java 使用枚举类的实例
  5. 服务器需要指定dns吗,Windows Server2012 安装配置DNS服务器方法详解
  6. ae效果英文版翻译对照表_AE CS6 最全特效中英翻译
  7. 阿里面试算法题(一)
  8. Java那些不为人知的技巧
  9. P、NP、NPC问题
  10. CH340刷新OLED12864
  11. 用计算机怎么打出X,电脑键盘x号怎么打出来
  12. 支付宝17年新春红包技术体系剖析
  13. 最新 eCharts 世界地图国家名映射
  14. neovim安装 vim-plug插件管理器安装
  15. 王家林老师人工智能AI 第26课:使用Apriori对美食店的消费者进行美食推荐 老师微信13928463918
  16. liferay中的社区(Communities)概念
  17. 2020年Web前端面试题及答案----ES6篇
  18. 分享一些写博客的实用工具
  19. 微信小程序一双日记-项目分享
  20. jmeter基础操作,图文

热门文章

  1. 介绍一些ddos产品的厂家
  2. 【概念】区块链中账本是什么?通用区块链平台账本概念介绍,一个谁都能看懂的账本概念
  3. android 打砖块教程,scratch教程-打砖块游戏
  4. linux0.11 阅读笔记
  5. 成本最低的Elance提现方式 — Moneybookers
  6. JavaWeb自学笔记
  7. bilibili自动上传视频脚本(纯ruby)
  8. cocos2d-x太空大战小游戏
  9. 数字IC设计学习笔记_8位7段数码管1
  10. HDU5510 Bazinga(KMP)