本来想爬一波无聊图,唉,竟然加密了。。。。

还好是base64

不说了,代码献上 2018.12.14 有效。。。。。

import requests
from bs4 import BeautifulSoup
import base64,timebase64_list = []
print('====开始爬取=====')
starttime = time.time()
for i in range(50,79):url = 'http://jandan.net/ooxx/page-{}#comments'.format(i)
# url = 'http://jandan.net/ooxx/page-50#comments'r = requests.get(url=url, headers={'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36'})r.encoding = 'utf-8'soup = BeautifulSoup(r.text, 'lxml')ol = soup.find(name='ol',attrs={"class":"commentlist"})li_List = ol.find_all(name='li')for li in li_List:try:p = li.find(name='p')if '\n' in p.text:continue# print(p.text)
            base64_list.append(p.text)except AttributeError:continue
endtime = time.time()
inttime = endtime - starttime
print('=====爬取结束====\n用时{}秒'.format(inttime))
print('=====开始解析====')
full_url = []  #解析完毕地址url
for www in base64_list:try:k = base64.b64decode(www)b = 'http:' + k.decode()# print(b)
        full_url.append(b)except ValueError:print(1)
print('=====解析完毕=====')
print('===载入本地文件夹===')image_start_time = time.time()
for index in range(0, len(full_url)):item = full_url[index]full_path = 'jdimg/' + str(index) + '.jpg'k = requests.get(item).content# print(k)with open(full_path,'wb') as f:f.write(k)
end_time_time = time.time()
print('用时%.2s秒'%(end_time_time-image_start_time))
# print(full_url)

转载于:https://www.cnblogs.com/xxy614899502/p/10120209.html

python爬取煎蛋网妹子图,已解密图片~~~~~相关推荐

  1. python爬取煎蛋网妹子图

    看了小甲鱼的python教学视频,爬取煎蛋网妹子图的代码已经不适用了,网上其它人的代码多有报错,本萌新结合其他人的方法,终于写出一个可行的,在此分享_(:з)∠)_(运行非常慢就是了) import ...

  2. python 爬虫爬取煎蛋网妹子图,我1T的硬盘装满了!

    前言 大家好,这里是「brucepk」爬虫 系列教程.此系列教程以实例项目为材料进行分析,从项目中学习 python 爬虫,跟着我一起学习,每天进步一点点. 煎蛋网站 image 很多朋友都反应学 p ...

  3. 利用Selenium爬取煎蛋网妹纸图原来是这么简单!!!

    上期说到,下期更新爬取煎蛋网妹纸的selenium版本,它来了!!! 获取页面url信息 获取图片url信息 永久性保存图片 注释: 想要获取GeckoDriver安装包的小伙伴,可以给博主留言或者搜 ...

  4. Python爬取煎蛋网的妹子图

    煎蛋网其中有一个版面,全是好看的小姐姐.本着美女是学习的第一动力的原则,写个程序把小姐姐们都下载下来. URL:http://jiandan.net/ooxx 程序结构 分析目标网页 提取目标信息 将 ...

  5. Python 爬取煎蛋网随手拍

    百度百科对爬虫的定义为:网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动的抓取万维网信息的程序或者脚本.另外一些不常使用的名字还有蚂蚁, ...

  6. python 爬取煎蛋网妹子的图片

    昨晚跑完步,回家看了点小甲鱼的python视频,讲了点爬虫相关知识,于是今天兴致来了,尝试自己写写看,晚上再回去看看他是怎么实现的. 写的过程中发现对于正则表达式这块真是个坑,很多时候都我都是将一些u ...

  7. 简单应用Selenium+PhantomJS来抓取煎蛋网妹子图

    那天有朋友找我一起抓妹子图片,像我这么正派的人,肯定是要抱着学习的目的--打开网页,哇!又-又要上火了.... 话不多说,先看看网页吧! 熟练的打开网页,找到妹子图,然后F12打开开发者工具,定位,o ...

  8. Python Scrapy 爬取煎蛋网妹子图实例(一)

    前面介绍了爬虫框架的一个实例,那个比较简单,这里在介绍一个实例 爬取 煎蛋网 妹子图,遗憾的是 上周煎蛋网还有妹子图了,但是这周妹子图变成了 随手拍, 不过没关系,我们爬图的目的是为了加强实战应用,管 ...

  9. 爬取煎蛋网中的妹子图

    看了小甲鱼爬取煎蛋网的视频,但是当时无论怎么写都写不出来,后来又看了一点其他视频,心血来潮把那段代码重写了一次,总算成功了,也算是解决一个心病吧,唯一美中不住的是还是不太会使用find函数,慢慢来吧, ...

最新文章

  1. Python基础总结(1)
  2. php SQLite mysql_PHP实现的sqlite数据库连接类
  3. OpenGL保守光栅化
  4. 一天一道算法题--5.30---递归
  5. 爬虫框架:scrapy
  6. 变形transform小结 1216
  7. java类修饰词和内部类详解
  8. Java-虚拟机-常量池的表现方式
  9. 这个低代码报表开发平台,操作类似Excel,用好了不需要加班
  10. dataguard类型转换与模式转化
  11. java 线程亲缘性_基于多线程应用特性的多/众核系统片上互连与缓存一致性整体优化方法...
  12. 电子元器件篇---三极管
  13. 为什么不能睁一只眼闭一只眼_“睁一只眼,闭一只眼”才是人生的最高境界
  14. 2018年python薪资_最好的Python:2017和2018年至今我最喜欢的文章集
  15. ubuntu安装wine时停在了“configuring ttf-mscorefonts-installer”怎么办
  16. TreeMap、二叉树
  17. 已被Windows defender smartscreen阻止
  18. 学习笔记1--自动驾驶系统架构
  19. 企业如何选择合适的精益生产方案?
  20. 租船题库整理 - 简答题、论述题

热门文章

  1. 记一次对某假冒征信站点的实战渗透
  2. 零基础考二级python大概需要拿出多长时间?
  3. 名不副实的雅迪高端品牌VFLY,为何“不高端”?
  4. IOS 辅助工具Reveal
  5. 免费的Windows系统的条形码打印工具
  6. Ubuntu 安装百度云bcloud
  7. 域名绑定https流程操作步骤
  8. python中集合的定义以及如何创建集合
  9. 计算广告学习笔记 4.4竞价广告系统-流量预测
  10. WebPlayer9 视频点播系统