Python之爬虫-校花网

#!/usr/bin/env python
# -*- coding:utf-8 -*-import re
import requests# 拿到校花网主页的内容
response = requests.get('http://www.xiaohuar.com/')
data = response.text# 拿到校花网所有的图片链接
results = re.findall('lazysrc="(.*?)"', data)
for result in results:  # type:str# 判断是不是有链接的if result.startswith('htt'):passelse:img_result = 'http://www.xiaohuar.com/' + result# 获取图片内容img_response = requests.get(img_result)img_data = img_response.contentimg_name = result.split('/')[3]img_filename = img_name + '.jpg'print(img_filename)# 保存图片内容with open(img_filename, 'wb') as f:  # write,read,wb是写入二进制f.write(img_data)print('爬取成功一张')

转载于:https://www.cnblogs.com/nickchen121/p/10825901.html

Python之爬虫-校花网相关推荐

  1. Python 爬虫 校花网

    爬虫:是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本. 福利来了  校花网 ,首先说为什么要爬这个网站呢,第一这个网站简单爬起来容易,不会受到打击,第二呢 你懂得.... 1.第一步,需要下 ...

  2. Python爬取校花网,妈妈再也不会担心我不给她发女朋友照片了

    本文同步发表于我的微信公众号,扫一扫文章底部的二维码或在微信搜索 极客导航 即可关注,每个工作日都有文章更新. 一.概况 上一篇我们用一个表情网站入门了爬虫,爬了很多表情.今天我们继续在爬的路上,今天 ...

  3. python爬取校花网的图片

    import re import os.path import requests import hashlib import timerespose=requests.get('http://www. ...

  4. Python爬虫实战一 | 抓取取校花网的所有妹子

     今天晚上顺带就实际的写写工具,我们刚学完Python的基础语法!抓点妹子带回家~ 总结一下之前的吧,我写了关于Python爬虫的六节课程,也就是六篇文章,文章有点简洁,但是很细节,如果还有不懂的请加 ...

  5. Python爬虫框架 scrapy 入门经典project 爬取校花网资源、批量下载图片

    ####1.安装scrapy 建议:最好在新的虚拟环境里面安装scrapy 注意:博主是在 Ubuntu18.04 + Python3.6 环境下进行开发的,如果遇到安装scrapy不成功请自行百度/ ...

  6. day01 初见python爬虫之“爬校花网”和“自动登录github”

    首先我们来解释一下几个概念: 1.什么是爬虫? 爬取数据. 2.什么是互联网? 由一堆网络设备.把一台台的计算机互联到一起称之为互联网. 3.互联网建立的目的: 数据的传递与数据的共享. 4.什么是数 ...

  7. Python爬虫:正则表达式爬取校花网

    #正则表达式爬取校花网 # 网址 url = 'http://www.xiaohuar.com' #分页爬取大学校花图片共16页640张美图 1.导入模块 import requests import ...

  8. python爬校花网笔记

    import requests import re #正则表达式 from bs4 import BeautifulSoup #爬虫bs4 import os #爬高考校花网 def xiaohua( ...

  9. 一篇入门级Scrapy框架(校花网)

    心血来潮,写一篇校花网爬取. 准备工作: 要用到request模块 需要的库和包(twisted,scrapy,pypiwin32)自行安装,python环境自行安装. url:'http://www ...

最新文章

  1. 《分布式系统:概念与设计》一3.5.2 IEEE 802.11无线LAN
  2. [转]SQL语句大全
  3. 人生规划:20岁到60岁我该干什么
  4. php+模版取余,PHP取余函数介绍MOD(x,y)与x%y_php技巧
  5. 软件测试实验二条件覆盖和条件组合覆盖
  6. 消防工程师 10.1 火灾自动报警系统-组成和工作原理
  7. DELPHI读取网页源文件和获取字符串
  8. 图形学知识基础:三维变换,旋转(欧拉角旋转与万向锁,绕任意轴旋转,四元数)
  9. 工业大数据白皮书(2019版)
  10. Windows 10 1809 on ubuntu1804 完美安装docker
  11. 如何截取整个网页长图,福利到,整个网页长图该怎样截取
  12. 对比Excel两个sheet的数据是否相同
  13. 深度解析:一文让你领略支付宝应用架构的厉害之处!
  14. WinRAR(5.70)去广告
  15. 大话设计模式策略模式_多种方法实现商场促销
  16. DateADD日期Sql
  17. 长沙距离中国的“凤凰城”还有多远?
  18. 另类的唯品会和得物比价
  19. (附源码)计算机毕业设计SSM智慧校园防疫管理平台
  20. 中医理论--恢复体力最好的食物

热门文章

  1. easyui 取消按钮_jQueryEasyUI 重写“确定”与“取消”按钮
  2. 计算机视觉实验三-全景图像拼接
  3. vs2010 beta2中vc++开发体验~~
  4. 在matlab中以图像中心为旋转轴逆时针旋转30度自编程序,MATLAB数学建模习题
  5. 字体大宝库:16款漂亮的免费英文手写字体推荐
  6. 【USB设备设计】-- CDC 设备开发(虚拟串口设备)
  7. Codeforces 750D New Year and Fireworks 暴力BFS
  8. maven install时跳过test
  9. 如何让div靠右_css 如何使元素靠左或靠右对齐呢?
  10. 目标检测-定位蒸馏:logit蒸馏与feature蒸馏之争