Python轻松爬取Rosimm写真网站全部图片
RosimmImage
爬取Rosimm写真网站图片
有图有真相
def main_start(url):"""爬虫入口,主要爬取操作"""try:r = requests.get(url+'.html', headers=HEADERS, timeout=10).textprint(url+'.html')name_index = 0# 套图名,也作为文件夹名folder_name = BeautifulSoup(r, 'lxml').find('h1',class_='article-title').find('a').text.encode('ISO-8859-1').decode('utf-8')with lock:if make_dir(folder_name):# 套图张数max_count = BeautifulSoup(r, 'lxml').find('div',class_='pagination2').find_all('li')[-2].find('a').get_text()print('-------max_count-----'+max_count)# 套图页面page_urls=[]for i in range(1,(int(max_count)+1)):if i==1:page_urls.append(url + '.html')else:page_urls.append(url + '_' + str(i)+'.html')# 图片地址for index, page_url in enumerate(page_urls):print('-----page_url-----'+page_url)result = requests.get(page_url, headers=HEADERS, timeout=10).textimg_url=BeautifulSoup(result,'lxml').find('article',class_='article-content').find_all('img')for s_img_url in img_url:real_img='http://www.rosimm8.com'+s_img_url.get('src')print('-----real_img-----'+real_img)name_index=name_index+1save_pic(real_img,name_index)except Exception as e:print(e)
全部代码传送门:https://github.com/SiberiaDante/RosimmImage
仅供学习参考使用
转载于:https://www.cnblogs.com/shen-hua/p/9261625.html
Python轻松爬取Rosimm写真网站全部图片相关推荐
- python最新官网图片_Python轻松爬取Rosimm写真网站全部图片
RosimmImage 有图有真相 def main_start(url): """ 爬虫入口,主要爬取操作 """ try: r = re ...
- Python爬虫爬取美女写真实例
Python爬虫爬取美女写真实例 微信关注公众号:夜寒信息 致力于为每一位用户免费提供更优质技术帮助与资源供给,感谢支持! 这是我写的一个较为简单的爬虫代码,用于爬取美女写真(咳咳,当然是正规 ...
- python爬表情包_教你用Python来爬取表情包网站的所有表情图片
教你用Python来爬取表情包网站的所有表情图片 配置环境 安装Python 开发环境 3X系列 win + R 打开运行,输入cmd,输入python,进行验证是否安装Python win + R ...
- 详细实例:用python爬虫爬取幽默笑话网站!(建议收藏)
前言: 今天为大家带来的内容是详细实例:用python爬虫爬取幽默笑话网站!(建议收藏),文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下! 爬取网站为 ...
- Python爬虫-爬取快看漫画网图片并拼接成漫画长图
Python爬虫-爬取快看漫画网图片并拼接成漫画长图 1.爬取图片 2.拼接图片 1.爬取图片 import os import requests from bs4 import BeautifulS ...
- Python爬虫爬取伯乐在线网站信息
一.环境搭建 1.创建环境 执行pip install scrapy安装scrapy 使用scrapy startproject ArticleSpider创建scrapy项目 使用pycharm导入 ...
- python每隔一段时间保存网页内容_利用Python轻松爬取网页题库答案!教孩子不怕尴尬了!...
大家有没有遇到这种令人尴尬的情况:"好不容易在网上找到需要的资源数据,可是不容易下载下来!"如果是通过一页一页的粘贴复制来下载,真的让人难以忍受,特别是像我这种急性子,真得会让人窒 ...
- python爬取学校题库_利用Python轻松爬取网页题库答案!教孩子不怕尴尬了!
大家有没有遇到这种令人尴尬的情况:"好不容易在网上找到需要的资源数据,可是不容易下载下来!"如果是通过一页一页的粘贴复制来下载,真的让人难以忍受,特别是像我这种急性子,真得会让人窒 ...
- Python爬虫爬取美剧网站
一直有爱看美剧的习惯,一方面锻炼一下英语听力,一方面打发一下时间.之前是能在视频网站上面在线看的,可是自从广电总局的限制令之后,进口的美剧英剧等貌似就不在像以前一样同步更新了. 但是,作为一个宅dia ...
最新文章
- Android实时获取音量(单位:分贝)
- 搜狗分身技术再进化,让AI合成主播“动”起来
- mysql和SQLYog工具使用
- python基础第三章选择结构答案-零基础学Python--------第3章 流程控制语句
- [USACO1.1]贪婪的送礼者Greedy Gift Givers
- QT的QScriptEngineAgent类的使用
- qt中实现绘制图形与截图
- unix查询内存使用率_Elasticsearch高级调优方法论之——根治慢查询
- 点亮两个发光管用c语言编辑,第二个试验:用单片机点亮一个闪烁的发光管-----51单片机汇编语言试验教程 - CSDN博客...
- nginx ngx_http_index_module(默认初始页)
- jquery详细基础教程
- bat命令调用rar进行文件夹压缩
- iOS性能优化(一)卡顿优化
- cruzer php sandisk 闪迪u盘量产工具_SanDisk Cruzer Micro
- 【大话设计模式】第0章 面向对象基础
- 嵌入式linux与pc串口传输文件基于lrzsz
- openssl验证证书是否由CA证书颁发的问题
- 编写程序描述影视歌三栖艺人
- google手机连接WIFI后总会提示“无法连接互联网“的解决方法
- Android studio成品源码项目日历备忘录记事本,该日历备忘录app实现了日历查看
热门文章
- 跟我学Springboot开发后端管理系统4:数据库连接池Druid和HikariCP
- 面试官问:Integer 如何实现节约内存和提升性能的?
- 碰到Maven依赖冲突,想砸电脑?这个IDEA插件必须了解一下...
- 原理暂且不谈,定时器你当真会用?
- 近400万奖金!2021全国人工智能大赛来了
- 报名即将截止,中国移动“梧桐杯”大数据应用创新大赛,寻找大数据敢想者!...
- 图神经网络从入门到入门
- 如何通俗地讲解对偶问题?尤其是拉格朗日对偶lagrangian duality?
- 即将 50 岁的雷军,重新回到手机战场
- 做项目经理到底有多爽?