RosimmImage

有图有真相

def main_start(url):

"""

爬虫入口,主要爬取操作

"""

try:

r = requests.get(url+'.html', headers=HEADERS, timeout=10).text

print(url+'.html')

name_index = 0

# 套图名,也作为文件夹名

folder_name = BeautifulSoup(r, 'lxml').find(

'h1',class_='article-title').find('a').text.encode('ISO-8859-1').decode('utf-8')

with lock:

if make_dir(folder_name):

# 套图张数

max_count = BeautifulSoup(r, 'lxml').find(

'div',class_='pagination2').find_all('li')[-2].find('a').get_text()

print('-------max_count-----'+max_count)

# 套图页面

page_urls=[]

for i in range(1,(int(max_count)+1)):

if i==1:

page_urls.append(url + '.html')

else:

page_urls.append(url + '_' + str(i)+'.html')

# 图片地址

for index, page_url in enumerate(page_urls):

print('-----page_url-----'+page_url)

result = requests.get(

page_url, headers=HEADERS, timeout=10).text

img_url=BeautifulSoup(result,'lxml').find('article',class_='article-content').find_all('img')

for s_img_url in img_url:

real_img='http://www.rosimm8.com'+s_img_url.get('src')

print('-----real_img-----'+real_img)

name_index=name_index+1

save_pic(real_img,name_index)

except Exception as e:

print(e)

仅供学习参考使用

python最新官网图片_Python轻松爬取Rosimm写真网站全部图片相关推荐

  1. Python轻松爬取Rosimm写真网站全部图片

    RosimmImage 爬取Rosimm写真网站图片 有图有真相 def main_start(url):"""爬虫入口,主要爬取操作""" ...

  2. python爬虫网页中的图片_Python爬虫爬取一个网页上的图片地址实例代码

    本文实例主要是实现爬取一个网页上的图片地址,具体如下. 读取一个网页的源代码: import urllib.request def getHtml(url): html=urllib.request. ...

  3. python——图片爬虫:爬取爱女神网站(www.znzhi.net)上的妹子图 进阶篇

    在上一篇博客中:python--图片爬虫:爬取爱女神网站(www.znzhi.net)上的妹子图 基础篇 我讲解了图片爬虫的基本步骤,并实现了爬虫代码 在本篇中,我将带领大家对基础篇中的代码进行改善, ...

  4. Python网络爬虫(九):爬取顶点小说网站全部小说,并存入MongoDB

    前言:本篇博客将爬取顶点小说网站全部小说.涉及到的问题有:Scrapy架构.断点续传问题.Mongodb数据库相关操作. 背景: Python版本:Anaconda3 运行平台:Windows IDE ...

  5. python最新官网图片_python爬取福利网站图片完整代码

    存起来 自己学习... import requests,bs4,re,os,threading class MeiNvTu: def __init__(self): self.url_main='ht ...

  6. python爬虫教学百度云_python爬虫爬取百度网盘-怎么做一个百度网盘搜索引擎

    因为要做去转盘网,所以一定要爬取网盘资源,本来想自己写一个爬虫挺不容易的,不想分享出来,但最后还是决定了拿给大家一起看吧,毕竟有交流才有进步,有兴趣的朋友也可以看看我写的其他日志或者关注我,会发现去转 ...

  7. 如何使用python爬取百度图片_python实现爬取百度图片的方法示例

    本文实例讲述了python实现爬取百度图片的方法.分享给大家供大家参考,具体如下: import json import itertools import urllib import requests ...

  8. python爬去百度图片_python实现爬取百度图片的方法示例

    本文实例讲述了python实现爬取百度图片的方法.分享给大家供大家参考,具体如下: import json import itertools import urllib import requests ...

  9. python爬虫百度图片_python实现爬取百度图片的方法示例

    本文实例讲述了python实现爬取百度图片的方法.分享给大家供大家参考,具体如下: import json import itertools import urllib import requests ...

最新文章

  1. 软件开发的比喻:园艺
  2. mark关于Java语言Static的生命周期
  3. Win8 官方培训课程
  4. for(;;)和 while(1) 有什么区别吗?for()和while()的使用情景。
  5. WebStorm文件类型关联设置
  6. python异步高并发_python高并发异步服务器核心库forkcore使用方法
  7. Linux:(ubuntu)命令行下显示方框的问题
  8. python3怎么使用pyrex_python pyrex windows 编译C可执行文件
  9. 【深度优先搜索】计蒜客:置换的玩笑
  10. ubuntu18.04安装mysql8.0中遇到的问题及解决方法
  11. Atitit webservice的发现机制 discover机制
  12. python 连接数据库 慢_python自动结束mysql慢查询会话的实例代码
  13. libuv 原理_nodejs如何利用libuv实现事件循环和异步
  14. 【14年浙江省赛 ZOJ 3780】Paint the Grid Again【图转换】
  15. unity--newtonsoft.json解析
  16. OSChina 周二乱弹 —— 基于现代生物化学的长生不老药炼制教程
  17. C语言根据汉字拼音首字母排序
  18. 国内智能网联汽车信息安全政策汇总及思考
  19. 男人不能没钱女人不能没爱
  20. paper survey之——多机器人协作介绍(Multi-Robot System, MRS)

热门文章

  1. SQL实现筛选出连续3天登录用户与窗口函数
  2. 潭州教育学python_潭州教育-Python学习笔记@基础讲解作业1
  3. 跟潭州学院的强子老师学习网络爬虫---爬取全书网
  4. Spring -Spring的 DI - 依赖注入的 使用学习
  5. CMU15445 2020 B+TREE简单记录
  6. 插入(insert)
  7. Oracle中merge into的使用方法
  8. 初次接触DHT11温度传感器
  9. 春节假期顺延30天!网友:酸了!员工不乐意了……
  10. 深度学习主机环境配置: Ubuntu16.04+GeForce GTX 1080+TensorFlow