煎蛋网妹子图爬虫(requests库实现)

文章目录

  • 煎蛋网妹子图爬虫(requests库实现)
    • 一、前言
      • 环境配置
    • 二、完整代码

一、前言

说到煎蛋网爬虫,相比很多人都写过,我这里试着用request库简单的完成,爬取煎蛋网的妹子图并保存到本地,直接上爬取效果。

环境配置

1、requests库
2、BeautifulSoup库
3、os库

二、完整代码

import requests
from bs4 import BeautifulSoup
import os# 创建一个soup对象
def get_soup(url):r = requests.get(url, headers=headers)html = r.textreturn BeautifulSoup(html, 'html.parser')# 获取原图链接并将图片保存到本地
def get_jpg(soup):global indexfor link in soup.find_all('a', {'class': 'view_img_link'}):href = link.get('href')with open('{}{}.jpg'.format(root, index), 'wb') as f:f.write(requests.get('http:' + href).content)print('成功爬取%d张图片' % index)index += 1if __name__ == '__main__':root = 'D:\\meizi\\'os.mkdir(root)  #创建一个文件夹index = 1    # 初始化图片索引depth = 30   # 指定爬取页数url = 'http://jandan.net/ooxx'headers = {'referer': 'http://jandan.net/','user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64; rv:47.0) Gecko/20100101 Firefox/47.0'}for i in range(depth):soup = get_soup(url)get_jpg(soup)url = 'http:' + soup.find('a', {'class': 'previous-comment-page'}).get('href')

煎蛋网妹子图爬虫(requests库实现)相关推荐

  1. Python爬虫之煎蛋网妹子图爬虫,解密图片链接加密方式

    之前在鱼C论坛的时候,看到很多人都在用Python写爬虫爬煎蛋网的妹子图,当时我也写过,爬了很多的妹子图片.后来煎蛋网把妹子图的网页改进了,对图片的地址进行了加密,所以论坛里面的人经常有人问怎么请求的 ...

  2. python爬虫 煎蛋网妹子图 动态爬虫1

    ------来自某潮汕人的菜鸟教程     爬虫目标网站:http://jandan.net/ooxx     爬虫目标中文名称:煎蛋网 妹子图     爬虫需求:分析js下载 煎蛋网的妹子图     ...

  3. python爬虫--下载煎蛋网妹子图到本地

    1 # -*- coding:utf-8 -*- 2 """ 3 下载煎蛋妹子到本地,通过selenium.正则表达式.phantomjs.Beautifulsoup实现 ...

  4. Python爬虫之煎蛋网妹子图(一)

    python爬虫是数据挖掘与数据处理中的重要一部分,为了让大家深入了解爬虫,这里会更新爬虫系列教程及例子.第一篇来送福利啦!!!http://jandan.net/ooxx,先进来看一眼,是不是动力十 ...

  5. Python Scrapy 爬取煎蛋网妹子图实例(一)

    前面介绍了爬虫框架的一个实例,那个比较简单,这里在介绍一个实例 爬取 煎蛋网 妹子图,遗憾的是 上周煎蛋网还有妹子图了,但是这周妹子图变成了 随手拍, 不过没关系,我们爬图的目的是为了加强实战应用,管 ...

  6. python 爬取煎蛋网妹子的图片

    昨晚跑完步,回家看了点小甲鱼的python视频,讲了点爬虫相关知识,于是今天兴致来了,尝试自己写写看,晚上再回去看看他是怎么实现的. 写的过程中发现对于正则表达式这块真是个坑,很多时候都我都是将一些u ...

  7. python爬虫入门-煎蛋网妹子图片下载

    知识点:多线程/BeautifulSoup/正则表达式/hashlib/base64/requests 参考: python爬虫之反爬虫情况下的煎蛋网图片爬取初步探索 煎蛋网的反扒用了个障眼法..首页 ...

  8. python学习之 爬取煎蛋网美女图

    用到库 os ,requests, base64 os简单介绍:点这里 requests介绍:点这里 base64介绍:点这里 其中 requests和 base64属于第三方库,需要自己安装 pip ...

  9. Python爬虫 煎蛋网全站妹子图爬虫

    爬取流程 从煎蛋网妹子图第一页开始抓取: 爬取分页标签获得最后一页数字: 根据最后一页页数,获得所有页URL: 迭代所有页,对页面所有妹子图片url进行抓取:访问图片URL并且保存图片到文件夹. 开始 ...

最新文章

  1. osgEarth用户手册
  2. Bigpipe---FaceBook使用的页面加载技术
  3. IDEA 运行spingboot时出现Process finished with exit code -1073741819 (0xC0000005)
  4. profile、服务、特征、属性之间的关系
  5. 设计灵感案例|教你图像在海报中可以如何摆放!
  6. python调用通达信公式_通达信公式-主力雷达Python化
  7. 形容等待时间长的句子_形容等待很久的句子
  8. 量化投资学习-16:从波粒二象性和叠加原理看股票的三面:市场面、基本面、技术面
  9. 对校招生培养工作的建议_19、贵单位对我院学生培养工作有何建议:
  10. Sql STUFF 用法
  11. Python:语音处理,实现在线朗读RFC文档或本地文本文件
  12. c语言提取字符串里面的数字,一个截取字符串中数字的函数
  13. TestBird《2021中国手游测试白皮书》---海外手游
  14. 读书档案-心流:最优体验心理学
  15. CodeSys轴控指令使用方法
  16. GHM:Gradient Harmonized Single-stage Detector
  17. hdu 6194string string string 后缀自动机
  18. 【计算机网络】数据流简单分析
  19. W5500+DHCP+DNS+MQTT
  20. GPU大百科全书 第一章:美女 方程与几何

热门文章

  1. 字节算法题--N阶台阶,每次走一步或两步,计算共有多少种走法,并将每种走法打印出来。
  2. 通过howler.js实现在Android下的微信浏览器自动播放音频
  3. 计算机老师发展的现状,计算机专业教师队伍的现状分析.doc
  4. 给力回馈!亲~时间有限哦!
  5. 一次重新的认识--第二次随笔
  6. 手机虚拟视频替换摄像头_利用OBS虚拟摄像头实现假装开会
  7. 项目管理应树立“三种理念”(转)
  8. asp.net调用飞信免费发短信
  9. 人工智能发展方向是什么?AI如何改变世界?《AI未来》
  10. 对于后台站点的用户活跃度统计 除了记录用户登陆时间进行筛选,还有没有别的方法