所用Python环境为:python 3.3.2   用到的库为:urllib.request    re

废话不多说,先上代码:

import urllib.request
import re#获得当前页面的页数page_name
def get_pagenum(url):req = urllib.request.Request(url)req.add_header('User-Agent','Mozilla/5.0 (Windows NT 6.3; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.102 Safari/537.36')res = urllib.request.urlopen(req)html = res.read().decode('utf-8')p = r'<span class="current-comment-page">[^"]+</span>'temp = re.search(p,html)page_num = temp.group()[36:39]return page_num#将此页面上的图片写入我们的mm文件夹中
def get_img(page_url):req = urllib.request.Request(page_url)req.add_header('User-Agent','Mozilla/5.0 (Windows NT 6.3; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.102 Safari/537.36')res = urllib.request.urlopen(req)html = res.read().decode('utf-8')p = r'<img src="([^"]+\.jpg)"'url_list = re.findall(p,html)num = 0for each in url_list:file = open('C:/Users/lenovo/Desktop/mm/'+each[-8:]+'.jpg','wb')if each[0:5] == 'http:':res = urllib.request.urlopen(each)else:res = urllib.request.urlopen('http:'+each)file.write(res.read())file.close()#只能直接运行
if __name__ == '__main__':url = 'http://jandan.net/ooxx/'page_num = get_pagenum(url)for i in range(10):   #抓取了十个页面上美女图片page_url = url + 'page-'+str(page_num)+'#comments'get_img(page_url)page_num = int(page_num) - 1#下面是写正则的时候方便看所以粘贴过来的连接
#<img src="//ws3.sinaimg.cn/mw600/006wUWIjgy1fgxrw8goikj30hs0qodh7.jpg" style="max-width: 480px; max-height: 750px;">#http://jandan.net/ooxx/page-143#comments#<span class="current-comment-page">[141]</span>#  http://wx3.sinaimg.cn/mw600/661eb95cly1fgioxk7mk3j20xc1e01f1.jpg#<img src="//wx1.sinaimg.cn/mw600/006wUWIjgy1fgxg2yj5f3j30g70s6dgw.jpg" style="max-width: 480px; max-height: 750px;">

结果如下:

由于时间原因,我只抓取了“煎蛋网”上的十个页面的美女图片罢了,大家可以更改其中的循环次数,可以抓取很多,这里我只抓取了250个图片,一共51.2kb,哈哈,可以很好的欣赏美女图片了,看的都要流鼻血了。。。

当然,此程序还是不够完善,只是我初学python网络爬虫的小作品罢了,以后再些更加完善的。接下来的一段时间真的得好好准备期末考试和考研了,加油!

参考来源:  https://zhuanlan.zhihu.com/p/26442105

Note:没有经过我的同意,请勿随便转载!谢谢。

转载于:https://www.cnblogs.com/jeavenwong/p/7078585.html

用python来抓取“煎蛋网”上面的美女图片,尺度很大哦!哈哈相关推荐

  1. python爬虫——抓取煎蛋网ooxx妹子图的一个小工具

    一点学习成果,仅限学习交流! 一.部分源码: def get_page(html):# 获取下一页链接start1 = str(html).find("Older Comments" ...

  2. python爬虫图片实例-Python爬虫爬取煎蛋网图片代码实例

    这篇文章主要介绍了Python爬虫爬取煎蛋网图片代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 今天,试着爬取了煎蛋网的图片. 用到的包: ...

  3. Python爬虫爬取煎蛋网图片代码实例

    这篇文章主要介绍了Python爬虫爬取煎蛋网图片代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 今天,试着爬取了煎蛋网的图片. 用到的包: ...

  4. 用Python爬虫抓取煎蛋(jandan.net)无聊图和妹子图

    用Python爬虫抓取煎蛋(jandan.net)无聊图和妹子图,有需要的朋友可以参考下. 初学Python, 练手写了个程序 通过Python爬虫抓取煎蛋无聊图和妹子图,存储到本地硬盘 使用了pyq ...

  5. python 爬虫爬取煎蛋网妹子图,我1T的硬盘装满了!

    前言 大家好,这里是「brucepk」爬虫 系列教程.此系列教程以实例项目为材料进行分析,从项目中学习 python 爬虫,跟着我一起学习,每天进步一点点. 煎蛋网站 image 很多朋友都反应学 p ...

  6. Python Scrapy 爬取煎蛋网妹子图实例(一)

    前面介绍了爬虫框架的一个实例,那个比较简单,这里在介绍一个实例 爬取 煎蛋网 妹子图,遗憾的是 上周煎蛋网还有妹子图了,但是这周妹子图变成了 随手拍, 不过没关系,我们爬图的目的是为了加强实战应用,管 ...

  7. 简单应用Selenium+PhantomJS来抓取煎蛋网妹子图

    那天有朋友找我一起抓妹子图片,像我这么正派的人,肯定是要抱着学习的目的--打开网页,哇!又-又要上火了.... 话不多说,先看看网页吧! 熟练的打开网页,找到妹子图,然后F12打开开发者工具,定位,o ...

  8. Python爬虫抓取煎蛋(jandan.net)无聊图

    1 #!/usr/bin/python 2 #encoding:utf-8 3 ''' 4 @python 3.6.1 5 @author: 1109159477@qq.com 6 @create d ...

  9. python爬图代码实例_Python爬虫爬取煎蛋网图片代码实例

    这篇文章主要介绍了Python爬虫爬取煎蛋网图片代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 今天,试着爬取了煎蛋网的图片. 用到的包: ...

最新文章

  1. [LeetCode]题解(python):086-Partition List
  2. 神奇的python(六)之python的串口操作(pyserial)
  3. 十.激光SLAM框架学习之LeGO-LOAM框架---算法原理和改进、项目工程代码
  4. 软件概要设计文档(终)
  5. linux下用grep命令根据文件内容进行关键字搜索[linux ubuntu grep] -转
  6. java虚拟机工作原理_Java虚拟机工作原理具体解释
  7. [msi]获取msi安装包的ProductCode
  8. Cheatsheet: 2013 04.01 ~ 04.16
  9. Vue使用JsBarcode生成条形码
  10. HAL库学习笔记-10 HAL库外设驱动框架概述
  11. Android编译时冲突报错的完美解决方案
  12. Linux CentOS7系统配置IP地址
  13. 蓄水池采样算法的python实现_蓄水池抽样及实现
  14. zemax设置 像方远心_像方远心光学系统具有以下特征
  15. eventhandler java_事件驱动模型的简单Java实现
  16. [软考]项目管理之十二大项目管理输入输出、工具技术、作用及内容总结
  17. 惠普服务器装系统无法识别u盘,惠普uefi bios无法识别u盘的解决方法
  18. Criteria查询用法
  19. VSCode如何去掉Monokai主题下的绿色下划线
  20. [bzoj-4808]马 题解

热门文章

  1. 数学计算机教学教研新闻,数学教学与信息技术融合专题学习教研活动
  2. 连续变量离散化的几种方法
  3. iPhone全线降价代表苹果已到强弩之末
  4. fifo页面置换算法java_缓存算法(页面置换算法)-FIFO、LFU、LRU
  5. 创意与策划——网络营销的魂与骨
  6. CentOS7破解root密码
  7. 小马哥----高仿苹果6sp主板型号A9910-尾插盖板A992标示 刷机拆机图与开机界面图
  8. 游戏服务器架构的演化
  9. 信奥赛一本通1099第n小的质数
  10. THUPC2019/CTS2019/APIO2019游记