看了小甲鱼的python教学视频,爬取煎蛋网妹子图的代码已经不适用了,网上其它人的代码多有报错,本萌新结合其他人的方法,终于写出一个可行的,在此分享_(:з)∠)_(运行非常慢就是了)

import requests
from bs4 import BeautifulSoup
from selenium import webdriver
import urllib.requestdef get_page(url):#得到当前页码req = urllib.request.Request(url)req.add_header('User-Agent','Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.100 Safari/537.36')response = urllib.request.urlopen(url)html = response.read().decode('utf-8')a = html.find("current-comment-page") + 23b = html.find(']',a)return (html[a:b])def img_down(soup, n):# 解析soup并下载temp = 0text = soup.select('.view_img_link')imglist = []for i in text:imglist.append(i['href'])temp += 1if temp == n:breakfor i in imglist:tempurl = 'http:' + str(i)try:tempes = requests.get(tempurl, timeout=3)except requests.exceptions.ConnectionError:print('下载失败!')continuefile_name = "picture" + '\\' + str(i)[23:] + ".jpg"  # 拼接图片名,picture为程序所在目录的文件夹print('正在下载:' + file_name)with open(file_name, 'wb') as f:f.write(tempes.content)print("此页下载完毕!")url = 'http://jandan.net/ooxx' # 打开浏览器并登陆目标网址
browser = webdriver.Chrome()#浏览器的驱动需放在安装python的目录下
num = int(input('每页最大下载张数:'))
pages = int(input('下载几页:'))page_num = int(get_page(url))+1#得到当前页码
for i in range(pages):page_num -= 1print(page_num)page_url = url + '/page-' + str(page_num) + '#comments'#拼出每页的网址browser.get(page_url)soup = BeautifulSoup(browser.page_source, 'html.parser')print('正在下载第%d页'%page_num)img_down(soup,num)browser.close()

python爬取煎蛋网妹子图相关推荐

  1. python爬取煎蛋网妹子图,已解密图片~~~~~

    本来想爬一波无聊图,唉,竟然加密了.... 还好是base64 不说了,代码献上 2018.12.14 有效..... import requests from bs4 import Beautifu ...

  2. python 爬虫爬取煎蛋网妹子图,我1T的硬盘装满了!

    前言 大家好,这里是「brucepk」爬虫 系列教程.此系列教程以实例项目为材料进行分析,从项目中学习 python 爬虫,跟着我一起学习,每天进步一点点. 煎蛋网站 image 很多朋友都反应学 p ...

  3. 利用Selenium爬取煎蛋网妹纸图原来是这么简单!!!

    上期说到,下期更新爬取煎蛋网妹纸的selenium版本,它来了!!! 获取页面url信息 获取图片url信息 永久性保存图片 注释: 想要获取GeckoDriver安装包的小伙伴,可以给博主留言或者搜 ...

  4. Python爬取煎蛋网的妹子图

    煎蛋网其中有一个版面,全是好看的小姐姐.本着美女是学习的第一动力的原则,写个程序把小姐姐们都下载下来. URL:http://jiandan.net/ooxx 程序结构 分析目标网页 提取目标信息 将 ...

  5. Python 爬取煎蛋网随手拍

    百度百科对爬虫的定义为:网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动的抓取万维网信息的程序或者脚本.另外一些不常使用的名字还有蚂蚁, ...

  6. python 爬取煎蛋网妹子的图片

    昨晚跑完步,回家看了点小甲鱼的python视频,讲了点爬虫相关知识,于是今天兴致来了,尝试自己写写看,晚上再回去看看他是怎么实现的. 写的过程中发现对于正则表达式这块真是个坑,很多时候都我都是将一些u ...

  7. 简单应用Selenium+PhantomJS来抓取煎蛋网妹子图

    那天有朋友找我一起抓妹子图片,像我这么正派的人,肯定是要抱着学习的目的--打开网页,哇!又-又要上火了.... 话不多说,先看看网页吧! 熟练的打开网页,找到妹子图,然后F12打开开发者工具,定位,o ...

  8. Python Scrapy 爬取煎蛋网妹子图实例(一)

    前面介绍了爬虫框架的一个实例,那个比较简单,这里在介绍一个实例 爬取 煎蛋网 妹子图,遗憾的是 上周煎蛋网还有妹子图了,但是这周妹子图变成了 随手拍, 不过没关系,我们爬图的目的是为了加强实战应用,管 ...

  9. 爬取煎蛋网中的妹子图

    看了小甲鱼爬取煎蛋网的视频,但是当时无论怎么写都写不出来,后来又看了一点其他视频,心血来潮把那段代码重写了一次,总算成功了,也算是解决一个心病吧,唯一美中不住的是还是不太会使用find函数,慢慢来吧, ...

最新文章

  1. “元宇宙”概念引发AR/VR新一轮投资潮,去年Q4融资总额达120亿,超过此前2年总和...
  2. 说说身边产品的用户体验
  3. Firetruck(DFS+回溯)
  4. python函数知识四 迭代器、生成器
  5. 英特尔与博雅睿视共同发布SVT-AVS3实时编码器
  6. qt中combox怎么使其下拉菜单的长度变长
  7. ICANN总裁Fadi Chehadé:IPv6峰会全面推动了IPv6在中国的发展与产业落地
  8. Hive分区表创建,增加及删除
  9. PHP获取指定月份第一天、最后一天
  10. 计算机专业的创新创业规划书,计算机及相关专业创新创业教育指导书.pdf
  11. matlab实现像素分类,定义使用 Tversky 损失的自定义像素分类层
  12. window常用设置和命令
  13. JAVA以及常用开源框架读音发音和介绍
  14. KataGo线程/权重/显卡
  15. ORACLE解析SOAPXML报文,xmltype extractvalue extract LPX-00210 中文乱码
  16. 本科毕设-基于C8051单片机的身份识别系统设计
  17. 2017-2021系统集成项目管理师综合知识易错题整理
  18. 大白话教你认识 Kafka 背后优秀的架构设计
  19. 【人机交互】课程知识点梳理及习题
  20. hadoop上传和下载文件过程【博学谷学习记录】

热门文章

  1. mysql慕课版_MySQL数据库管理与开发(慕课版)
  2. python中input是什么_Python中input函数的用法是什么?_后端开发
  3. 从985非科班到网易伏羲CV算法岗
  4. linux学习笔记2.0
  5. java nio socket
  6. 三个分数、大球吃小球、五子棋
  7. Nacos + Spring Cloud Gateway动态路由配置
  8. 医药行业2021年1月投资月报:加配弹性品种,稳守核心资产-20210106
  9. Linux之C++毫秒级计时方法
  10. DSP与DAC数字音频接口时钟分析