RosimmImage

爬取Rosimm写真网站图片

有图有真相

def main_start(url):"""爬虫入口,主要爬取操作"""try:r = requests.get(url+'.html', headers=HEADERS, timeout=10).textprint(url+'.html')name_index = 0# 套图名,也作为文件夹名folder_name = BeautifulSoup(r, 'lxml').find('h1',class_='article-title').find('a').text.encode('ISO-8859-1').decode('utf-8')with lock:if make_dir(folder_name):# 套图张数max_count = BeautifulSoup(r, 'lxml').find('div',class_='pagination2').find_all('li')[-2].find('a').get_text()print('-------max_count-----'+max_count)# 套图页面page_urls=[]for i in range(1,(int(max_count)+1)):if i==1:page_urls.append(url + '.html')else:page_urls.append(url + '_' + str(i)+'.html')# 图片地址for index, page_url in enumerate(page_urls):print('-----page_url-----'+page_url)result = requests.get(page_url, headers=HEADERS, timeout=10).textimg_url=BeautifulSoup(result,'lxml').find('article',class_='article-content').find_all('img')for s_img_url in img_url:real_img='http://www.rosimm8.com'+s_img_url.get('src')print('-----real_img-----'+real_img)name_index=name_index+1save_pic(real_img,name_index)except Exception as e:print(e)

全部代码传送门:https://github.com/SiberiaDante/RosimmImage

仅供学习参考使用

转载于:https://www.cnblogs.com/shen-hua/p/9261625.html

Python轻松爬取Rosimm写真网站全部图片相关推荐

  1. python最新官网图片_Python轻松爬取Rosimm写真网站全部图片

    RosimmImage 有图有真相 def main_start(url): """ 爬虫入口,主要爬取操作 """ try: r = re ...

  2. Python爬虫爬取美女写真实例

    Python爬虫爬取美女写真实例 微信关注公众号:夜寒信息 致力于为每一位用户免费提供更优质技术帮助与资源供给,感谢支持!     这是我写的一个较为简单的爬虫代码,用于爬取美女写真(咳咳,当然是正规 ...

  3. python爬表情包_教你用Python来爬取表情包网站的所有表情图片

    教你用Python来爬取表情包网站的所有表情图片 配置环境 安装Python 开发环境 3X系列 win + R 打开运行,输入cmd,输入python,进行验证是否安装Python win + R ...

  4. 详细实例:用python爬虫爬取幽默笑话网站!(建议收藏)

    前言: 今天为大家带来的内容是详细实例:用python爬虫爬取幽默笑话网站!(建议收藏),文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下! 爬取网站为 ...

  5. Python爬虫-爬取快看漫画网图片并拼接成漫画长图

    Python爬虫-爬取快看漫画网图片并拼接成漫画长图 1.爬取图片 2.拼接图片 1.爬取图片 import os import requests from bs4 import BeautifulS ...

  6. Python爬虫爬取伯乐在线网站信息

    一.环境搭建 1.创建环境 执行pip install scrapy安装scrapy 使用scrapy startproject ArticleSpider创建scrapy项目 使用pycharm导入 ...

  7. python每隔一段时间保存网页内容_利用Python轻松爬取网页题库答案!教孩子不怕尴尬了!...

    大家有没有遇到这种令人尴尬的情况:"好不容易在网上找到需要的资源数据,可是不容易下载下来!"如果是通过一页一页的粘贴复制来下载,真的让人难以忍受,特别是像我这种急性子,真得会让人窒 ...

  8. python爬取学校题库_利用Python轻松爬取网页题库答案!教孩子不怕尴尬了!

    大家有没有遇到这种令人尴尬的情况:"好不容易在网上找到需要的资源数据,可是不容易下载下来!"如果是通过一页一页的粘贴复制来下载,真的让人难以忍受,特别是像我这种急性子,真得会让人窒 ...

  9. Python爬虫爬取美剧网站

    一直有爱看美剧的习惯,一方面锻炼一下英语听力,一方面打发一下时间.之前是能在视频网站上面在线看的,可是自从广电总局的限制令之后,进口的美剧英剧等貌似就不在像以前一样同步更新了. 但是,作为一个宅dia ...

最新文章

  1. Android实时获取音量(单位:分贝)
  2. 搜狗分身技术再进化,让AI合成主播“动”起来
  3. mysql和SQLYog工具使用
  4. python基础第三章选择结构答案-零基础学Python--------第3章 流程控制语句
  5. [USACO1.1]贪婪的送礼者Greedy Gift Givers
  6. QT的QScriptEngineAgent类的使用
  7. qt中实现绘制图形与截图
  8. unix查询内存使用率_Elasticsearch高级调优方法论之——根治慢查询
  9. 点亮两个发光管用c语言编辑,第二个试验:用单片机点亮一个闪烁的发光管-----51单片机汇编语言试验教程 - CSDN博客...
  10. nginx ngx_http_index_module(默认初始页)
  11. jquery详细基础教程
  12. bat命令调用rar进行文件夹压缩
  13. iOS性能优化(一)卡顿优化
  14. cruzer php sandisk 闪迪u盘量产工具_SanDisk Cruzer Micro
  15. 【大话设计模式】第0章 面向对象基础
  16. 嵌入式linux与pc串口传输文件基于lrzsz
  17. openssl验证证书是否由CA证书颁发的问题
  18. 编写程序描述影视歌三栖艺人
  19. google手机连接WIFI后总会提示“无法连接互联网“的解决方法
  20. Android studio成品源码项目日历备忘录记事本,该日历备忘录app实现了日历查看

热门文章

  1. 跟我学Springboot开发后端管理系统4:数据库连接池Druid和HikariCP
  2. 面试官问:Integer 如何实现节约内存和提升性能的?
  3. 碰到Maven依赖冲突,想砸电脑?这个IDEA插件必须了解一下...
  4. 原理暂且不谈,定时器你当真会用?
  5. 近400万奖金!2021全国人工智能大赛来了
  6. 报名即将截止,中国移动“梧桐杯”大数据应用创新大赛,寻找大数据敢想者!...
  7. 图神经网络从入门到入门
  8. 如何通俗地讲解对偶问题?尤其是拉格朗日对偶lagrangian duality?
  9. 即将 50 岁的雷军,重新回到手机战场
  10. 做项目经理到底有多爽?