关于
在一个安静的夜晚,我缓慢的打开了电脑,望着已经睡着的父母,我轻轻的把门关上,看着斗鱼颜值主播的魅力,我不尽感叹,要是每天都可以不需要那么麻烦的去看那该有多好!
于是我想起了最近刚学的爬虫,嘴角露出了迷之微笑。

开始

我原本以为我这样的菜鸟,如果想爬的话应该只能用xpath来爬取斗鱼图片,可是当我在爬取途中想获取地址,发现了很奇怪的现象

之后我去百度了,看到他们说斗鱼是哪js写的所以我xpath找不到…
所以我就去看了一下jsonpath这个库…

jsonpath语法和xpath语法


json在线解析传送门
链接:https://www.json.cn/

jsonpath流程图

1.先打开斗鱼链接
2.按下f12
3.找到这个
4.复制到json解析,找到图片链接

5.找到链接url的规律

代码块

import jsonpath
import requests
import timename=input('请输入图片关键字:')
#发送请求
url='https://www.douyu.com/japi/search/api/searchShow?kw='+name+'&page=1&pageSize=20'
#模拟浏览器
headers={'user-agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/83.0.4103.97 Safari/537.36'}
#解析数据
response=requests.get(url,headers=headers).json()n=0#jsonpath需要位置,和目标
img_url_list=jsonpath.jsonpath(response,'$..roomSrc')for img in img_url_list:#延迟一下time.sleep(1)#获取名字,因为有些分割有dy1所以用ifif (img.split('/')[-1])=='dy1':file_name=img.split('/')[-2]else:file_name=img.split('/')[-1]#再次发送请求,转换为二进制数data=requests.get(img,headers=headers).content#保存数据with open(file_name,'wb')as f:f.write(data)n=n+1print('第%d张保存成功'%n)

结果

总结
坚持就是胜利,不忘初心,方得始终,每天进步一点点。

利用python爬虫爬取斗鱼图片(简单详细)相关推荐

  1. 利用Python爬虫爬取斗鱼直播间信息,以及直播的实际人数!

    首先我准备利用mysql来存储我爬取的信息,建一个host表如下: 然后下载pymysql ,利用它与数据库链接,因为在这里我只涉及到写入的操作: Unit_Mtsql 然后就是使用Beautiful ...

  2. python指定爬取虎牙图片(简单详细)

    关于 看了很久的斗鱼主播图片,我的欲望也欲来不满,望着他隔壁家的虎牙,我的心开始动摇,最后,我忍不住点开了看,发现了新鲜的图片,人就是如此,祖传手艺岂可落下,于是我开始爬取虎牙的图片- 想看斗鱼的指定 ...

  3. 【爬虫】利用Python爬虫爬取小麦苗itpub博客的所有文章的连接地址并写入Excel中(2)...

    [爬虫]利用Python爬虫爬取小麦苗itpub博客的所有文章的连接地址并写入Excel中(2) 第一篇( http://blog.itpub.net/26736162/viewspace-22865 ...

  4. python爬虫,爬取下载图片

    python爬虫,爬取下载图片 分别引入以下三个包 from urllib.request import urlopen from bs4 import BeautifulSoup import re ...

  5. Python爬虫爬取相关图片

    简要的实现实现Python爬虫爬取百度贴吧页面上的图片,下面的网页就是本篇博客所要爬的网页,当然看到的只是其中的一部分图片,是所要爬取的页面, 而下图则是最终的爬取的图片: 接下来就简要的讲讲爬取的整 ...

  6. python爬虫爬取网页图片_Python爬虫:爬取网页图片

    先分析查找要爬取图片的路径 在浏览器F12 审查元素 整体实现代码 # -- coding:UTF-8 -- import requests from bs4 import BeautifulSoup ...

  7. 利用Python爬虫爬取网页福利图片

    最近几天,学习了爬虫算法,通过参考书籍,写下自己简单爬虫项目: 爬取某福利网站的影片海报图片 环境:anaconda3.5+spyder3.2.6 目录 1.本节目标 2.准备工作 3.抓取分析 4. ...

  8. 利用python爬虫爬取京东商城商品图片

    笔者曾经用python第三方库requests来爬取京东商城的商品页内容,经过解析之后发现只爬到了商品页一半的图片.(这篇文章我们以爬取智能手机图片为例) 当鼠标没有向下滑时,此时查看源代码的话,就会 ...

  9. 详细分析如何利用python批量爬取百度图片

    这篇文章主要写的是利用python网络爬虫批量来爬取百度图片并保存到文件夹中. 首先我们打开百度图片这个网页:https://image.baidu.com/ 我们现在随便搜一个类型的图片,比如小狗, ...

最新文章

  1. “ git commit”和“ git push”之间有什么区别?
  2. qq纵横四海源码_【0基础】纵横中文网python爬虫实战
  3. Qt creator5.7 OpenCV249之pyrUp函数(含源码下载)
  4. iOS:Core Data 中的简单ORM
  5. 瑞丽,边陲的旖旎风情
  6. 极度偷懒 - 实现算命程序中tabcontrol的“美化”
  7. matlab 箱图不显示异常值_欧姆龙E5EZ温控器PV显示值跳动异常的处理,一看就懂...
  8. C#Const与static readonly的区别
  9. linux 怎么添加文件类型,如何在Linux/Unix上添加基于文件类型的文件扩展名?
  10. linux tomcat8+jdk1.8u201百度云盘下载
  11. Java实现通过证书访问Https请求
  12. linux温度监控软件,PSensor:Linux下硬件温度监控软件
  13. TS进阶之infer
  14. 泰坦尼克号幸存者的预测
  15. 华为路由交换由浅入深系列(二):静态路由、浮动路由、默认路由配置以及华为路由协议优先级总结
  16. 关于电脑硬盘灯常亮,电脑很卡问题
  17. 脑图神器 -- freemind
  18. 量化交易 米筐 多因子策略总结
  19. 几个“快递偏门”赚钱方法!
  20. win10使用easybcd误删引导进不去系统解决办法

热门文章

  1. 【python】画折线图
  2. 代数系统,二元运算,半群,含幺半群,群
  3. 使用 Abp.Zero 搭建第三方登录模块(一):原理篇
  4. python实现FFT,IFFT
  5. QtCreator添加文件夹
  6. 【项目记录】-上门洗车-汽车服务
  7. ubuntu 找不到固态硬盘
  8. Java学习日记1——基础认知
  9. 【Numba】加速计算
  10. 记vue+drf前后端分离学习过程(2)