1.准备工作

  • url:“https://www.douyu.com/g_yz”
  • 爬取目标:

2.开始爬取

  • 目录结构
  • 代码
import requests, redef get_stable_image(url):headers = {"User-Agent": "Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.110 Safari/537.36"}# urlreq = requests.get(url=url, headers=headers)# print(req.request.headers)  # 测试请求头# 响应内容html = req.content.decode()# print(html)  # 测试网页内容# 获取image_url# 使用正则匹配目标内容reg = r'data-original="(.*?)" src='img_url_list = re.findall(reg, html)# print(img_url_list)  # 测试img_url# 提取数据count = 0for img_url in img_url_list:try:# 图片名称img_name = img_url.split('/')[-1] + ".jpg"except Exception as e:print(e)continueimg = requests.get(url=img_url)# 存储数据with open('images/01.爬取斗鱼图片/'+img_name, 'wb') as f:f.write(img.content)count += 1print("已爬取成功%d张图片" % count)if __name__ == '__main__':ret = get_stable_image("https://www.douyu.com/g_yz")

爬取成功

【爬虫】01-爬斗鱼妹子图相关推荐

  1. Python爬虫 - scrapy - 爬取妹子图 Lv1

    0. 前言 这是一个利用python scrapy框架爬取网站图片的实例,本人也是在学习当中,在这做个记录,也希望能帮到需要的人.爬取妹子图的实例打算分成三部分来写,尝试完善实用性. 系统环境 Sys ...

  2. Python之Scrapy爬虫实战--爬取妹子图

    1.前言 反正闲着也是闲着,不如来学习啊! 2.关键代码 新建项目 不会的同学可参考我的另一篇博文,这里不再赘述:Python之Scrapy爬虫实战–新建scrapy项目 这里只讲一下几个关键点,完整 ...

  3. Python 爬虫入门(二)——爬取妹子图

    Python 爬虫入门 听说你写代码没动力?本文就给你动力,爬取妹子图.如果这也没动力那就没救了. GitHub 地址: https://github.com/injetlee/Python/blob ...

  4. python爬虫-爬妹子图_Python 爬虫入门之爬取妹子图

    Python 爬虫入门之爬取妹子图 来源:李英杰  链接: https://segmentfault.com/a/1190000015798452 听说你写代码没动力?本文就给你动力,爬取妹子图.如果 ...

  5. python爬虫妹子图_Python 爬虫入门(二)——爬取妹子图

    Python 爬虫入门 听说你写代码没动力?本文就给你动力,爬取妹子图.如果这也没动力那就没救了. 公众号:[智能制造社区].欢迎关注,分享智能制造与编程那些事. 爬虫成果 当你运行代码后,文件夹就会 ...

  6. python爬虫(最新的可以爬的妹子图)

    最新的可以爬的妹子图 python爬虫(最新的可以爬的妹子图) 运行图片 完整代码(类似的代码分析文章站里很多,难度也不高,在此就不做细致分析了) python爬虫(最新的可以爬的妹子图) 入门了py ...

  7. 爬取妹子图(python):爬虫(bs+rq)+ gevent多线程

    爬取妹子图(python):爬虫(bs+rq)+ gevent多线程 简介 我观察爬取妹子图算是爬虫专业户必做的事情之一,所以我也做了一个,结果是有3.45GB,49847张图. 打算依靠这个图库做个 ...

  8. python多线程爬取妹子图

    python多线程爬取妹子图 python使用版本: 3.7 目的: 自己选择下载目录,逐个将主题图片保存到选定目录下. 效果: 一秒钟左右下载一张图片,下了七八十组图片暂时没什么问题,不放心的话,可 ...

  9. Node.js爬取妹子图-crawler爬虫的使用

    去年10月份写过<Node.js 2小时爬取驴妈妈8W+条旅游数据>.之前做的是使用request 做网路请求和 cheerio做DOM解析. 后来在网上看见了crawler,昨天就把cr ...

最新文章

  1. 计算机网络(本科)形成性,《计算机组网技术》作业形考网考形成性考核-国家开放大学电大本科...
  2. 新同事上来就把项目性能优化了一遍,瑟瑟发抖。。。
  3. 码农必读的 7 本计算机书
  4. Entity Framework4.0 (一)概述(EF4 的Database First方法)
  5. 基于visual Studio2013解决面试题之0608找出两个只出现一次的数
  6. Sharding-Sphere,Sharding-JDBC_分库分表(水平分库_水平分表)_Sharding-Sphere,Sharding-JDBC分布式_分库分表工作笔记004
  7. vMotion、SvMotion、HA和FT的详细对比说明
  8. DHTML【10】--Javascript
  9. Mac上设置共享视频音乐或照片
  10. c语言程序设计第五版李丽娟_c语言程序设计第五版习题答案解析
  11. java 爬虫 抓取 网易云音乐
  12. 在自己的项目中调用别人的库的方法(static lib库,dynamic lib库以及dll动态库)
  13. html中点击按钮闪现,vue使用v-if v-show页面闪烁,div闪现的解决方法
  14. 记住密码的那一刹那显示
  15. 使用windows时卸载office,后想恢复原来的office
  16. easyphp mysql_用EasyPHP本地搭建PHP环境 | Wopus
  17. 程序员创业:高智商的程序员为什么创业却屡屡失败?
  18. 价值1000块!关于敏捷项目管理的豆瓣高分推荐书单
  19. Sparrow: 适用于细粒度tasks低延迟调度的去中心化无状态分布式调度器
  20. 汉诺塔——老夫不管什么分析不分析,直接粗暴

热门文章

  1. Kafka系列 —— Kafka监控
  2. CKEditor5记
  3. 前端基础:通过表单元素实践《健康体检单》
  4. 百度飞桨全流程工具最新发布!零门槛 AI 开发平台全面升级
  5. 虹软Linux离线激活,虹软linux错误
  6. 【田亮曝Cindy趣事】
  7. 鼠标右键,以管理员身份在当前目录打开命令行窗口
  8. UE4 热更新系统开发
  9. DolphinScheduler PMC Chair 代立冬入选 2021 中国开源先锋 33 人之心尖上的开源人物!...
  10. linux设备驱动归纳总结(十一):简单的看门狗驱动