昨晚跑完步,回家看了点小甲鱼的python视频,讲了点爬虫相关知识,于是今天兴致来了,尝试自己写写看,晚上再回去看看他是怎么实现的。

写的过程中发现对于正则表达式这块真是个坑,很多时候都我都是将一些url转换成字符串进行处理的,尚需学习。

源码如下:

import urllib.request
import os
import re
"""python version 3.3.5author:killvoon"""def get_page(url):req = urllib.request.Request(url, headers = {'Connection': 'Keep-Alive','Accept': 'text/html, application/xhtml+xml, */*','Accept-Language': 'en-US,en;q=0.8,zh-Hans-CN;q=0.5,zh-Hans;q=0.3','User-Agent': 'Mozilla/5.0 (Windows NT 6.3; WOW64; Trident/7.0; rv:11.0) like Gecko'})url=urllib.request.urlopen(req).read()return(url)#获得不同网页的关键id号
def get_page_id(url):page=get_page(url)page=page.decode('utf-8')pattern = re.compile(r'<span class="current-comment-page">.*?</span>',re.S)page_id=re.findall(pattern,page)page_id=str(page_id[0])num=page_id.find('[')page_id=page_id[num+1:40]return page_iddef save_image(pic_name,cnt):direct_path='f:/test/'image_data = get_page(pic_name)image_path=direct_path+"煎蛋网妹子图片"+str(cnt)+".jpg"f=open(image_path,'wb')f.write(image_data)print("正在保存图片")f.close()#with open(image_path,'wb') as image_file:#  image_file.write(image_data)#image_file.close()#获得照片的url地址
def get_image_url(page_url,page_id):page_url=get_page(page_url).decode('utf-8')pattern = re.compile(r'<img src="(.*?)"',re.S)#pattern = re.compile(r'<img.*?src="(.*?)"',re.S)pic_name = re.findall(pattern,page_url)for i in range(len(pic_name)):print(pic_name[i])##print(re.match('http://ww'))  ##一开始用match,发现match只能匹配开头if re.search('http://ww',pic_name[i]):   ##这一步是我发现执行程序时候,可以生成妹子的图片,同样也会将一些其他非妹子的图片爬下来,于是加了一个判断,是不是妹子图片的地址cnt=str(page_id)+'-'+str(i)save_image(pic_name[i],cnt)else:print("你不是妹子,请走开!%s" %(pic_name[i]))def get_page_url(url,loop_num=2):page_id=get_page_id(url)page_id=int(page_id)print(type(page_id))for i in range(1,loop_num):page_url=url+'page-'+str(page_id)+'#comments'             get_image_url(page_url,page_id)page_id=page_id-i  def get_mm_pic():url="http://jandan.net/ooxx/"get_page_url(url,20)if __name__=='__main__':get_mm_pic()

咳咳。。。抓下来的图片有点污。。。请忽略。。。。

python 爬取煎蛋网妹子的图片相关推荐

  1. python爬取煎蛋网妹子图

    看了小甲鱼的python教学视频,爬取煎蛋网妹子图的代码已经不适用了,网上其它人的代码多有报错,本萌新结合其他人的方法,终于写出一个可行的,在此分享_(:з)∠)_(运行非常慢就是了) import ...

  2. Python Scrapy 爬取煎蛋网妹子图实例(一)

    前面介绍了爬虫框架的一个实例,那个比较简单,这里在介绍一个实例 爬取 煎蛋网 妹子图,遗憾的是 上周煎蛋网还有妹子图了,但是这周妹子图变成了 随手拍, 不过没关系,我们爬图的目的是为了加强实战应用,管 ...

  3. Python 爬取煎蛋网随手拍

    百度百科对爬虫的定义为:网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动的抓取万维网信息的程序或者脚本.另外一些不常使用的名字还有蚂蚁, ...

  4. Python爬取煎蛋网的妹子图

    煎蛋网其中有一个版面,全是好看的小姐姐.本着美女是学习的第一动力的原则,写个程序把小姐姐们都下载下来. URL:http://jiandan.net/ooxx 程序结构 分析目标网页 提取目标信息 将 ...

  5. python爬取煎蛋网妹子图,已解密图片~~~~~

    本来想爬一波无聊图,唉,竟然加密了.... 还好是base64 不说了,代码献上 2018.12.14 有效..... import requests from bs4 import Beautifu ...

  6. python 爬虫爬取煎蛋网妹子图,我1T的硬盘装满了!

    前言 大家好,这里是「brucepk」爬虫 系列教程.此系列教程以实例项目为材料进行分析,从项目中学习 python 爬虫,跟着我一起学习,每天进步一点点. 煎蛋网站 image 很多朋友都反应学 p ...

  7. python爬虫图片实例-Python爬虫爬取煎蛋网图片代码实例

    这篇文章主要介绍了Python爬虫爬取煎蛋网图片代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 今天,试着爬取了煎蛋网的图片. 用到的包: ...

  8. python爬图代码实例_Python爬虫爬取煎蛋网图片代码实例

    这篇文章主要介绍了Python爬虫爬取煎蛋网图片代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 今天,试着爬取了煎蛋网的图片. 用到的包: ...

  9. Python爬虫爬取煎蛋网图片代码实例

    这篇文章主要介绍了Python爬虫爬取煎蛋网图片代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 今天,试着爬取了煎蛋网的图片. 用到的包: ...

最新文章

  1. 软键盘挡住WebView中输入框解决方法
  2. 往自身页面提交和别处页面提交到本页的设计小技巧
  3. 记录下UIButton的图文妙用和子控件的优先显示
  4. 堆初始化-二叉堆一般用数组来表示。例如,根节点在数组中的位置是0,第n个位置的子节点分别在2n+1和 2n+2-icoding-void init_min_heap(PMinHeap pq, int
  5. Linux下source命令
  6. ubuntu16 安装opencv
  7. 微信小程序商城开发记录一之需求分析
  8. 黄巾之乱-服务器线程控制
  9. 新物种爆炸:认知升级时代的新商业思维
  10. python stdin.write_python – 将大量数据写入stdin
  11. java 识别图片 边框_atitit.验证码识别step3----去除边框---- 图像处理类库 attilax总结java版本...
  12. flink stream 终于上local 集群 运行起来
  13. Intel D435深度相机“No Frames Received!“问题
  14. AI TIME PhD实验室专场,四月隆重登场!
  15. 负载均衡技术之负载均衡器简介
  16. TextCNN——基于卷积神经网络的文本分类学习
  17. 为什么黑客都用Linux系统?原来是这四大原因
  18. 平面的截距式方程推导
  19. ObjectARX AutoCAD二次开发教程
  20. 异步下载文件 java_在浏览器中异步下载文件监听下载进度

热门文章

  1. android 字体滚动效果,2018-02-05 android 左右字滚动效果(跑马灯效果),能直接拿来用的...
  2. html页面显示天气,HTML – 如何显示openweathermap天气图标
  3. 电影知识图谱的智能问答系统在本机跑通实验及遇到问题的解决
  4. 串口、COM口、TTL、RS232、RS485区别详解
  5. 【普通玩家VS高手玩家】一带传奇游戏《俄罗斯方块儿》新作—实现AI自动玩游戏~
  6. tp用phpqrcode制作二维码,可在浏览器下载二维码
  7. eclipse java 连接mysql数据库出现中文 乱码问题
  8. python将照片转换成手绘图片
  9. opencv学习笔记及复习(二)读取摄像头以及获取图片类型
  10. 利用Android studio设计WeChat的门户界面