一直都想爬个视频玩玩于是…
分析网站
检查网页源码发现并没有视频信息 于是按F12 进入network中刷新页面发现 如下


request中的url地址才是真正的我们想要的地址,访问之后服务器返回明文json数据 于是豁然开朗
接下来我们点击 加载更多 去寻找是怎么翻页的 发现:


现在已经获取到所有必要的信息了 开始写程序:

import json
import requestsdef get_url(url, hander):try:r = requests.get(url, headers=hander, timeout=30)r.raise_for_status()r.encoding = r.apparent_encodingreturn r.textexcept requests.exceptions.ConnectTimeout:print("(1)连接超时")return ""except requests.exceptions.HTTPError as e:print(e)return ""
def prasing_page(html, hander,s):s = s+1   #页数+1json_data = json.loads(html)  #将json数据转换为python数据py_data = json_data['data']   #获取data的值for i in range(len(py_data)):try:print("\r当前进度第{}页>>>>>>>>>>>>>>{:.0f}%".format(s, i * 100 / len(py_data)), end="") #在一行显示进度with open('O:/ku6_viedo/'+py_data[i]['title']+'.mp4', 'wb') as f:r = requests.get(py_data[i]['playUrl'], headers=hander, timeout=30)f.write(r.content)f.close()except requests.exceptions.ConnectTimeout:print("(2)下载超时")continue  #如果下载超时则进行下一个视频下载
def main():hander = {"User-Agent": "Mozilla/5.0"}deep = 20      #定义总共爬取多少页s = 0         #定义一个变量 表示页数for i in range(deep): #循环爬取页面url = "https://********/video/feed?pageNo="+str(i)+"&pageSize=40&subjectId=76"html = get_url(url, hander)prasing_page(html, hander, s)main()



运行成功!

python爬虫 爬取视频 练习相关推荐

  1. python爬虫爬取视频_python爬虫:爬取网站视频

    新建一个py文件,代码如下: #!/usr/bin/python # -*- coding: UTF-8 -*- import urllib,re,requests import sys reload ...

  2. python网络爬虫_Python网络爬虫——爬取视频网站源视频!

    原标题:Python网络爬虫--爬取视频网站源视频! 学习前提 1.了解python基础语法 2.了解re.selenium.BeautifulSoup.os.requests等python第三方库 ...

  3. Python爬虫:爬取知乎上的视频,并把下载链接保存到md文件中

    Python爬虫:爬取知乎上的视频,并把下载链接保存到md文件中 1.需要的Python模块 主要是requests模块,用于得到的网页的数据 安装命令为:pip install requests 2 ...

  4. Python爬虫爬取Twitter视频、文章、图片

    Python爬虫爬取Twitter视频.文章.图片 Twitter的Python爬虫 https://github.com/bisguzar/twitter-scraper 2.2k星标 (2020. ...

  5. Python爬虫 爬取腾讯视频评论内容

    Python爬虫 爬取腾讯视频评论内容 腾讯视频评论内容在源码里是不可见,所以要使用抓包分析. 可安装fiddler代理服务器实现. 下面爬了腾讯视频评论内容(不包括回复),及发表评论者的id.昵称和 ...

  6. Python爬虫爬取微信朋友圈的方法,感兴趣的朋友可以了解下

    前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 小雨 | 作者 python教程 | 来源 接下来,我们将实现微信朋友圈的 ...

  7. python爬虫--爬取9某1看剧网电视剧

    文章目录 python爬虫--爬取91看剧网电视剧 爬取视频必备知识 思路 代码 合并视频 python爬虫–爬取91看剧网电视剧 爬取视频必备知识 https://www.91kanju.com/v ...

  8. Python爬虫——爬取股票信息

    Python爬虫--爬取股票信息 1. 准备工作 每一次浏览器访问网页,会自动向浏览器服务器发送本地的电脑信息(headers),远方服务器接收到信息后会反馈给你网页信息(response),然后电脑 ...

  9. 使用python爬虫爬取蓝调口琴网乐谱

    学习目标:使用python爬虫爬取蓝调口琴网乐谱 提示:这里可以添加学习目标 例如:一周掌握 Java 入门知识 学习内容: 使用爬虫爬取需要动态验证码(如手机短信验证码)登录的网站. 提示:这里可以 ...

  10. 如何用六步教会你使用python爬虫爬取数据

    前言: 用python的爬虫爬取数据真的很简单,只要掌握这六步就好,也不复杂.以前还以为爬虫很难,结果一上手,从初学到把东西爬下来,一个小时都不到就解决了. python爬出六部曲 第一步:安装req ...

最新文章

  1. DL-1 用一元二次方程 y=x^2+b 构建神经网络
  2. Linux常用性能分析工具汇总
  3. Windows下通过MinGW进行WxWidgets的动态编译与静态编译
  4. java设置access-allow_Java Web如何设置多个Access-Control-Allow-Origin
  5. LetCode: 150. 逆波兰表达式求值
  6. RuoYi-Cloud 部署篇_03(windows环境 Oracle + nginx版本)
  7. NSTimer实现读秒、倒计时等周期性操作
  8. 【Java每日一题】20161228
  9. android 9.0系统下载地址,安卓9.0正式版下载地址
  10. 五边形创意画_儿童美术创意绘画图片_儿童美术创意绘画作品
  11. 转:王树国,怎样的校长才是一位好校长?
  12. 【IPv6+燎原系列—第2期】IPv6+逐梦赛场,勇夺属于通信人的“金牌”
  13. 下载iCloud照片/文件的正确姿势(亲测好使)
  14. MACOS聚焦搜索无法搜索相应的软件和文件等,解决办法
  15. 新道格资讯 工会换届选举大会顺利召开
  16. 动态规划(pta例题)
  17. 视频、音频文件格式大全
  18. 大数据培训课程RDD的创建
  19. 【Swift Mac开发】纯代码创建NSViewController
  20. python 百度识图_python截图+百度ocr(图片识别)+ 百度翻译

热门文章

  1. mmsi是代表船舶什么_船舶常见的一些缩写
  2. antdesign 新增页面_ant design pro 新增页面
  3. TFIDF算法Java实现
  4. Meta 开源首个 AI 语音翻译系统,闽南话和英语可以直接语音互译
  5. 最小二乘法曲线拟合以及Matlab实现
  6. spring boot 中调用存储过程失败问题
  7. 20135202闫佳歆-第四章家庭作业-4.47+4.48
  8. cad沿线插入块 lisp_我有一组数有十几万个坐标点,如何利用lisp程序快速导入CAD中,并可以快速处理!...
  9. proteus仿真常见报错信息
  10. 深海迷航坐标传送代码_深海迷航全控制台代码一览