1.前言

本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理。

PS:如有需要Python学习资料的小伙伴可以点击下方链接自行获取

Python免费学习资料、代码以及交流解答点击即可加入


爬取视频的时候发现,现在的视频都是经过加密(m3u8),不再是mp4或者avi链接直接在网页显示,都是经过加密形成ts文件分段进行播放。

今天就教大家如果通过python爬取下载m3u8加密视频。

2.分析网页

1.电影视频来源


http://www.caisetv.com/

2.分析m3u8加密目录


http://www.caisetv.com/dongzuopian/chaidanzhuanjia/0-1.html

在视频播放的页面,通过F12可以查看网络数据包


https://xigua-cdn.haima-zuida.com/20210219/19948_fcbc225a/1000k/hls/index.m3u8

这里的ts就电影的加密分段视频


https://xigua-cdn.haima-zuida.com/20210219/19948_fcbc225a/1000k/hls/

上面的m3u8链接掉index.m3u8后,在拼上075a34cccdd000000.ts等ts名称就是分段视频的链接

如下所示:


https://xigua-cdn.haima-zuida.com/20210219/19948_fcbc225a/1000k/hls/075a34cccdd000000.ts

通过浏览器把这个分段视频下载后打开:

所以只要把所有的ts下载并合并就是完整的电影视频!!!

3.下载ts

1.下载ts分段视频

刚刚已经把ts的所有名称下载下来了

接下来通过python代码去读取这个文件,提取出名称,拼接链接后下载保存到一个文件夹里!


headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 6.3; Win64; x64; rv:84.0) Gecko/20100101 Firefox/84.0',}###下载ts文件
def download(url,name):r = requests.get(url, headers=headers)with open(name+"", "wb") as code:code.write(r.content)with open("index.m3u8","r") as f:ts_list = f.readlines()#去掉前面没用的信息
ts_list = ts_list[5:]
urlheader="https://xigua-cdn.haima-zuida.com/20210219/19948_fcbc225a/1000k/hls/"
count = 0
for i in ts_list:if "#" not in i:i = i.replace("\n","")download(urlheader+""+i,"cdzj2/"+str(count)+".ts")count = count+1print(count)

这样就可以把ts文件全部下载下来,但是一个一个下载很慢,下面通过多线程下载,提升下载速度!!!

2.多线程下载ts视频


for i in ts_list:if "#" not in i:i = i.replace("\n","")n = i[-7:]threading.Thread(target=download, args=(urlheader+""+i,"cdzj2/"+str(n),)).start()#download(urlheader+""+i,"cdzj2/"+str(count)+".ts")

通过多线程很快就可以将这些ts文件下载到本地!!!

4.合并ts

cmd合并文件


copy /b   *.ts   new.mp4

通过这个命令(cmd终端中运行),在含有ts文件的文件夹中就可以将ts文件合并(按名称顺序进行排列合并),并保存成new.mp4

5.总结

1.分析m3u8加密文件
2.python下载ts文件
3.cmd合并ts保存成mp4格式

Python爬取下载m3u8视频,原来这么简单!相关推荐

  1. python爬取下载m3u8加密视频,原来这么简单!

    1.前言 爬取视频的时候发现,现在的视频都是经过加密(m3u8),不再是mp4或者avi链接直接在网页显示,都是经过加密形成ts文件分段进行播放. 今天就教大家如果通过python爬取下载m3u8加密 ...

  2. python爬取网站m3u8视频,将ts解密成mp4,合并成整体视频

    一些网站会提供m3u8视频地址,以供下载观看.或者一些网站经过分析后发现是使用m3u8格式进行播放的,这时使用m3u8的地址链接就可以下载到相应的视频. 一.关于m3u8:(https://blog. ...

  3. python爬取抖音用户数据_使用python爬取抖音视频列表信息

    如果看到特别感兴趣的抖音vlogger的视频,想全部dump下来,如何操作呢?下面介绍介绍如何使用python导出特定用户所有视频信息 抓包分析 Chrome Deveploer Tools Chro ...

  4. 使用python爬取最右视频

    最近学习了python,在此记录一下用python爬取最右视频 首先安装mitmproxy,安装方式:pip install mitmproxy 因为我使用的是Windows系统,无法使用mitmpr ...

  5. python爬取b站评论_学习笔记(1):写了个python爬取B站视频评论的程序

    学习笔记(1):写了个python爬取B站视频评论的程序 import requests import json import os table='fZodR9XQDSUm21yCkr6zBqiveY ...

  6. python爬取bilibili弹幕_用Python爬取B站视频弹幕

    原标题:用Python爬取B站视频弹幕 via:菜J学Python 众所周知,弹幕,即在网络上观看视频时弹出的评论性字幕.不知道大家看视频的时候会不会点开弹幕,于我而言,弹幕是视频内容的良好补充,是一 ...

  7. python爬b站评论_学习笔记(1):写了个python爬取B站视频评论的程序

    学习笔记(1):写了个python爬取B站视频评论的程序 import requests import json import os table='fZodR9XQDSUm21yCkr6zBqiveY ...

  8. python爬取腾讯视频会员V力值

    python爬取腾讯视频会员V力值 练练手,只需要将cookies改成自己的 便即可运行. from bs4 import BeautifulSoup import requests import r ...

  9. python爬取腾讯视频弹幕_用Python爬取腾讯视频弹幕

    原标题:用Python爬取腾讯视频弹幕 via:菜J学Python 1.网页分析 本文以爬取<脱口秀大会 第3季>最后一期视频弹幕为例,首先通过以下步骤找到存放弹幕的真实url. 通过删减 ...

  10. 如何用python爬取数据_如何使用python爬取知乎数据并做简单分析

    原标题:如何使用python爬取知乎数据并做简单分析 一.使用的技术栈: 爬虫:python27 +requests+json+bs4+time 分析工具: ELK套件 开发工具:pycharm 数据 ...

最新文章

  1. 并发编程-08安全发布对象之发布与逸出
  2. linux支持sshd救援模式,单用户、救援模式、克隆、两机互联
  3. oracle-group by -having
  4. 【6】C++语法与数据结构之STL_list学生管理系统_链表外排序_函数指针
  5. 【JS 逆向百例】网洛者反爬练习平台第六题:JS 加密,环境模拟检测
  6. 我的考研~~~3-4月份总结
  7. 用Java发起HTTP请求与获取状态码(含状态码列表)
  8. 汉诺塔问题的c语言递归
  9. 网页爬虫工具BeautifulSoup使用总结
  10. 数字图像处理matlab蔡利梅,数字图像处理:使用MATLAB分析与实现:using MATLAB
  11. lammps计算聚合物例子_lammps计算金属扩散
  12. 大数据整合方案架构总结
  13. 移动通信网中的密码算法演进之完整性保护
  14. PMBOK(第六版) PMP笔记——《十三》第十三章(项目干系人管理)
  15. 用Python爬取B站弹幕并做成词云
  16. windows下服务器的数据的迁移解决方案
  17. 微小宝公众号排行榜_公众号排名 | 2020年2月公众号地区排行榜重磅发布
  18. 洛谷2336 BZOJ2754 SCOI2012 喵星球上的点名 SA 莫队 二分
  19. 工业4.0 资产管理壳学习笔记( 5) 模型中的语义,概念和字典
  20. 工业互联网的破局之道:存储资源盘活系统

热门文章

  1. speedoffice(Excel)图片上怎么添加文字
  2. html 半个字符,半角字符什么意思
  3. 剑指 Offer II 028. 展平多级双向链表
  4. 【子衿技术】DBA进阶之路
  5. 到了2017还在苦等房价下跌的人,你们可以醒醒了!
  6. 微信小程序长列表优化方案
  7. 全网最详细的Intel CPU体系结构分析(内核源码)
  8. H3C路由器多出口NQA+TRACK实现冗余
  9. php 数独计算器,问题描述:数独(Sudoku)是一款大众喜爱的数字逻辑游戏。玩家需要根据9X9盘面上的已知数字_题来了...
  10. 博物馆沉浸式体验如何彰显文化价值