用python来抓取“煎蛋网”上面的美女图片,尺度很大哦!哈哈
所用Python环境为:python 3.3.2 用到的库为:urllib.request re
废话不多说,先上代码:
import urllib.request import re#获得当前页面的页数page_name def get_pagenum(url):req = urllib.request.Request(url)req.add_header('User-Agent','Mozilla/5.0 (Windows NT 6.3; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.102 Safari/537.36')res = urllib.request.urlopen(req)html = res.read().decode('utf-8')p = r'<span class="current-comment-page">[^"]+</span>'temp = re.search(p,html)page_num = temp.group()[36:39]return page_num#将此页面上的图片写入我们的mm文件夹中 def get_img(page_url):req = urllib.request.Request(page_url)req.add_header('User-Agent','Mozilla/5.0 (Windows NT 6.3; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.102 Safari/537.36')res = urllib.request.urlopen(req)html = res.read().decode('utf-8')p = r'<img src="([^"]+\.jpg)"'url_list = re.findall(p,html)num = 0for each in url_list:file = open('C:/Users/lenovo/Desktop/mm/'+each[-8:]+'.jpg','wb')if each[0:5] == 'http:':res = urllib.request.urlopen(each)else:res = urllib.request.urlopen('http:'+each)file.write(res.read())file.close()#只能直接运行 if __name__ == '__main__':url = 'http://jandan.net/ooxx/'page_num = get_pagenum(url)for i in range(10): #抓取了十个页面上美女图片page_url = url + 'page-'+str(page_num)+'#comments'get_img(page_url)page_num = int(page_num) - 1#下面是写正则的时候方便看所以粘贴过来的连接 #<img src="//ws3.sinaimg.cn/mw600/006wUWIjgy1fgxrw8goikj30hs0qodh7.jpg" style="max-width: 480px; max-height: 750px;">#http://jandan.net/ooxx/page-143#comments#<span class="current-comment-page">[141]</span># http://wx3.sinaimg.cn/mw600/661eb95cly1fgioxk7mk3j20xc1e01f1.jpg#<img src="//wx1.sinaimg.cn/mw600/006wUWIjgy1fgxg2yj5f3j30g70s6dgw.jpg" style="max-width: 480px; max-height: 750px;">
结果如下:
由于时间原因,我只抓取了“煎蛋网”上的十个页面的美女图片罢了,大家可以更改其中的循环次数,可以抓取很多,这里我只抓取了250个图片,一共51.2kb,哈哈,可以很好的欣赏美女图片了,看的都要流鼻血了。。。
当然,此程序还是不够完善,只是我初学python网络爬虫的小作品罢了,以后再些更加完善的。接下来的一段时间真的得好好准备期末考试和考研了,加油!
参考来源: https://zhuanlan.zhihu.com/p/26442105
Note:没有经过我的同意,请勿随便转载!谢谢。
转载于:https://www.cnblogs.com/jeavenwong/p/7078585.html
用python来抓取“煎蛋网”上面的美女图片,尺度很大哦!哈哈相关推荐
- python爬虫——抓取煎蛋网ooxx妹子图的一个小工具
一点学习成果,仅限学习交流! 一.部分源码: def get_page(html):# 获取下一页链接start1 = str(html).find("Older Comments" ...
- python爬虫图片实例-Python爬虫爬取煎蛋网图片代码实例
这篇文章主要介绍了Python爬虫爬取煎蛋网图片代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 今天,试着爬取了煎蛋网的图片. 用到的包: ...
- Python爬虫爬取煎蛋网图片代码实例
这篇文章主要介绍了Python爬虫爬取煎蛋网图片代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 今天,试着爬取了煎蛋网的图片. 用到的包: ...
- 用Python爬虫抓取煎蛋(jandan.net)无聊图和妹子图
用Python爬虫抓取煎蛋(jandan.net)无聊图和妹子图,有需要的朋友可以参考下. 初学Python, 练手写了个程序 通过Python爬虫抓取煎蛋无聊图和妹子图,存储到本地硬盘 使用了pyq ...
- python 爬虫爬取煎蛋网妹子图,我1T的硬盘装满了!
前言 大家好,这里是「brucepk」爬虫 系列教程.此系列教程以实例项目为材料进行分析,从项目中学习 python 爬虫,跟着我一起学习,每天进步一点点. 煎蛋网站 image 很多朋友都反应学 p ...
- Python Scrapy 爬取煎蛋网妹子图实例(一)
前面介绍了爬虫框架的一个实例,那个比较简单,这里在介绍一个实例 爬取 煎蛋网 妹子图,遗憾的是 上周煎蛋网还有妹子图了,但是这周妹子图变成了 随手拍, 不过没关系,我们爬图的目的是为了加强实战应用,管 ...
- 简单应用Selenium+PhantomJS来抓取煎蛋网妹子图
那天有朋友找我一起抓妹子图片,像我这么正派的人,肯定是要抱着学习的目的--打开网页,哇!又-又要上火了.... 话不多说,先看看网页吧! 熟练的打开网页,找到妹子图,然后F12打开开发者工具,定位,o ...
- Python爬虫抓取煎蛋(jandan.net)无聊图
1 #!/usr/bin/python 2 #encoding:utf-8 3 ''' 4 @python 3.6.1 5 @author: 1109159477@qq.com 6 @create d ...
- python爬图代码实例_Python爬虫爬取煎蛋网图片代码实例
这篇文章主要介绍了Python爬虫爬取煎蛋网图片代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 今天,试着爬取了煎蛋网的图片. 用到的包: ...
最新文章
- [LeetCode]题解(python):086-Partition List
- 神奇的python(六)之python的串口操作(pyserial)
- 十.激光SLAM框架学习之LeGO-LOAM框架---算法原理和改进、项目工程代码
- 软件概要设计文档(终)
- linux下用grep命令根据文件内容进行关键字搜索[linux ubuntu grep] -转
- java虚拟机工作原理_Java虚拟机工作原理具体解释
- [msi]获取msi安装包的ProductCode
- Cheatsheet: 2013 04.01 ~ 04.16
- Vue使用JsBarcode生成条形码
- HAL库学习笔记-10 HAL库外设驱动框架概述
- Android编译时冲突报错的完美解决方案
- Linux CentOS7系统配置IP地址
- 蓄水池采样算法的python实现_蓄水池抽样及实现
- zemax设置 像方远心_像方远心光学系统具有以下特征
- eventhandler java_事件驱动模型的简单Java实现
- [软考]项目管理之十二大项目管理输入输出、工具技术、作用及内容总结
- 惠普服务器装系统无法识别u盘,惠普uefi bios无法识别u盘的解决方法
- Criteria查询用法
- VSCode如何去掉Monokai主题下的绿色下划线
- [bzoj-4808]马 题解