python 爬取煎蛋网妹子的图片
昨晚跑完步,回家看了点小甲鱼的python视频,讲了点爬虫相关知识,于是今天兴致来了,尝试自己写写看,晚上再回去看看他是怎么实现的。
写的过程中发现对于正则表达式这块真是个坑,很多时候都我都是将一些url转换成字符串进行处理的,尚需学习。
源码如下:
import urllib.request
import os
import re
"""python version 3.3.5author:killvoon"""def get_page(url):req = urllib.request.Request(url, headers = {'Connection': 'Keep-Alive','Accept': 'text/html, application/xhtml+xml, */*','Accept-Language': 'en-US,en;q=0.8,zh-Hans-CN;q=0.5,zh-Hans;q=0.3','User-Agent': 'Mozilla/5.0 (Windows NT 6.3; WOW64; Trident/7.0; rv:11.0) like Gecko'})url=urllib.request.urlopen(req).read()return(url)#获得不同网页的关键id号
def get_page_id(url):page=get_page(url)page=page.decode('utf-8')pattern = re.compile(r'<span class="current-comment-page">.*?</span>',re.S)page_id=re.findall(pattern,page)page_id=str(page_id[0])num=page_id.find('[')page_id=page_id[num+1:40]return page_iddef save_image(pic_name,cnt):direct_path='f:/test/'image_data = get_page(pic_name)image_path=direct_path+"煎蛋网妹子图片"+str(cnt)+".jpg"f=open(image_path,'wb')f.write(image_data)print("正在保存图片")f.close()#with open(image_path,'wb') as image_file:# image_file.write(image_data)#image_file.close()#获得照片的url地址
def get_image_url(page_url,page_id):page_url=get_page(page_url).decode('utf-8')pattern = re.compile(r'<img src="(.*?)"',re.S)#pattern = re.compile(r'<img.*?src="(.*?)"',re.S)pic_name = re.findall(pattern,page_url)for i in range(len(pic_name)):print(pic_name[i])##print(re.match('http://ww')) ##一开始用match,发现match只能匹配开头if re.search('http://ww',pic_name[i]): ##这一步是我发现执行程序时候,可以生成妹子的图片,同样也会将一些其他非妹子的图片爬下来,于是加了一个判断,是不是妹子图片的地址cnt=str(page_id)+'-'+str(i)save_image(pic_name[i],cnt)else:print("你不是妹子,请走开!%s" %(pic_name[i]))def get_page_url(url,loop_num=2):page_id=get_page_id(url)page_id=int(page_id)print(type(page_id))for i in range(1,loop_num):page_url=url+'page-'+str(page_id)+'#comments' get_image_url(page_url,page_id)page_id=page_id-i def get_mm_pic():url="http://jandan.net/ooxx/"get_page_url(url,20)if __name__=='__main__':get_mm_pic()
咳咳。。。抓下来的图片有点污。。。请忽略。。。。
python 爬取煎蛋网妹子的图片相关推荐
- python爬取煎蛋网妹子图
看了小甲鱼的python教学视频,爬取煎蛋网妹子图的代码已经不适用了,网上其它人的代码多有报错,本萌新结合其他人的方法,终于写出一个可行的,在此分享_(:з)∠)_(运行非常慢就是了) import ...
- Python Scrapy 爬取煎蛋网妹子图实例(一)
前面介绍了爬虫框架的一个实例,那个比较简单,这里在介绍一个实例 爬取 煎蛋网 妹子图,遗憾的是 上周煎蛋网还有妹子图了,但是这周妹子图变成了 随手拍, 不过没关系,我们爬图的目的是为了加强实战应用,管 ...
- Python 爬取煎蛋网随手拍
百度百科对爬虫的定义为:网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动的抓取万维网信息的程序或者脚本.另外一些不常使用的名字还有蚂蚁, ...
- Python爬取煎蛋网的妹子图
煎蛋网其中有一个版面,全是好看的小姐姐.本着美女是学习的第一动力的原则,写个程序把小姐姐们都下载下来. URL:http://jiandan.net/ooxx 程序结构 分析目标网页 提取目标信息 将 ...
- python爬取煎蛋网妹子图,已解密图片~~~~~
本来想爬一波无聊图,唉,竟然加密了.... 还好是base64 不说了,代码献上 2018.12.14 有效..... import requests from bs4 import Beautifu ...
- python 爬虫爬取煎蛋网妹子图,我1T的硬盘装满了!
前言 大家好,这里是「brucepk」爬虫 系列教程.此系列教程以实例项目为材料进行分析,从项目中学习 python 爬虫,跟着我一起学习,每天进步一点点. 煎蛋网站 image 很多朋友都反应学 p ...
- python爬虫图片实例-Python爬虫爬取煎蛋网图片代码实例
这篇文章主要介绍了Python爬虫爬取煎蛋网图片代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 今天,试着爬取了煎蛋网的图片. 用到的包: ...
- python爬图代码实例_Python爬虫爬取煎蛋网图片代码实例
这篇文章主要介绍了Python爬虫爬取煎蛋网图片代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 今天,试着爬取了煎蛋网的图片. 用到的包: ...
- Python爬虫爬取煎蛋网图片代码实例
这篇文章主要介绍了Python爬虫爬取煎蛋网图片代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 今天,试着爬取了煎蛋网的图片. 用到的包: ...
最新文章
- 软键盘挡住WebView中输入框解决方法
- 往自身页面提交和别处页面提交到本页的设计小技巧
- 记录下UIButton的图文妙用和子控件的优先显示
- 堆初始化-二叉堆一般用数组来表示。例如,根节点在数组中的位置是0,第n个位置的子节点分别在2n+1和 2n+2-icoding-void init_min_heap(PMinHeap pq, int
- Linux下source命令
- ubuntu16 安装opencv
- 微信小程序商城开发记录一之需求分析
- 黄巾之乱-服务器线程控制
- 新物种爆炸:认知升级时代的新商业思维
- python stdin.write_python – 将大量数据写入stdin
- java 识别图片 边框_atitit.验证码识别step3----去除边框---- 图像处理类库 attilax总结java版本...
- flink stream 终于上local 集群 运行起来
- Intel D435深度相机“No Frames Received!“问题
- AI TIME PhD实验室专场,四月隆重登场!
- 负载均衡技术之负载均衡器简介
- TextCNN——基于卷积神经网络的文本分类学习
- 为什么黑客都用Linux系统?原来是这四大原因
- 平面的截距式方程推导
- ObjectARX AutoCAD二次开发教程
- 异步下载文件 java_在浏览器中异步下载文件监听下载进度
热门文章
- android 字体滚动效果,2018-02-05 android 左右字滚动效果(跑马灯效果),能直接拿来用的...
- html页面显示天气,HTML – 如何显示openweathermap天气图标
- 电影知识图谱的智能问答系统在本机跑通实验及遇到问题的解决
- 串口、COM口、TTL、RS232、RS485区别详解
- 【普通玩家VS高手玩家】一带传奇游戏《俄罗斯方块儿》新作—实现AI自动玩游戏~
- tp用phpqrcode制作二维码,可在浏览器下载二维码
- eclipse java 连接mysql数据库出现中文 乱码问题
- python将照片转换成手绘图片
- opencv学习笔记及复习(二)读取摄像头以及获取图片类型
- 利用Android studio设计WeChat的门户界面