Python爬取下载m3u8视频,原来这么简单!
1.前言
本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理。
PS:如有需要Python学习资料的小伙伴可以点击下方链接自行获取
Python免费学习资料、代码以及交流解答点击即可加入
爬取视频的时候发现,现在的视频都是经过加密(m3u8),不再是mp4或者avi链接直接在网页显示,都是经过加密形成ts文件分段进行播放。
今天就教大家如果通过python爬取下载m3u8加密视频。
2.分析网页
1.电影视频来源
http://www.caisetv.com/
2.分析m3u8加密目录
http://www.caisetv.com/dongzuopian/chaidanzhuanjia/0-1.html
在视频播放的页面,通过F12可以查看网络数据包
https://xigua-cdn.haima-zuida.com/20210219/19948_fcbc225a/1000k/hls/index.m3u8
这里的ts就电影的加密分段视频
https://xigua-cdn.haima-zuida.com/20210219/19948_fcbc225a/1000k/hls/
上面的m3u8链接掉index.m3u8后,在拼上075a34cccdd000000.ts等ts名称就是分段视频的链接
如下所示:
https://xigua-cdn.haima-zuida.com/20210219/19948_fcbc225a/1000k/hls/075a34cccdd000000.ts
通过浏览器把这个分段视频下载后打开:
所以只要把所有的ts下载并合并就是完整的电影视频!!!
3.下载ts
1.下载ts分段视频
刚刚已经把ts的所有名称下载下来了
接下来通过python代码去读取这个文件,提取出名称,拼接链接后下载保存到一个文件夹里!
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 6.3; Win64; x64; rv:84.0) Gecko/20100101 Firefox/84.0',}###下载ts文件
def download(url,name):r = requests.get(url, headers=headers)with open(name+"", "wb") as code:code.write(r.content)with open("index.m3u8","r") as f:ts_list = f.readlines()#去掉前面没用的信息
ts_list = ts_list[5:]
urlheader="https://xigua-cdn.haima-zuida.com/20210219/19948_fcbc225a/1000k/hls/"
count = 0
for i in ts_list:if "#" not in i:i = i.replace("\n","")download(urlheader+""+i,"cdzj2/"+str(count)+".ts")count = count+1print(count)
这样就可以把ts文件全部下载下来,但是一个一个下载很慢,下面通过多线程下载,提升下载速度!!!
2.多线程下载ts视频
for i in ts_list:if "#" not in i:i = i.replace("\n","")n = i[-7:]threading.Thread(target=download, args=(urlheader+""+i,"cdzj2/"+str(n),)).start()#download(urlheader+""+i,"cdzj2/"+str(count)+".ts")
通过多线程很快就可以将这些ts文件下载到本地!!!
4.合并ts
cmd合并文件
copy /b *.ts new.mp4
通过这个命令(cmd终端中运行),在含有ts文件的文件夹中就可以将ts文件合并(按名称顺序进行排列合并),并保存成new.mp4
5.总结
1.分析m3u8加密文件
2.python下载ts文件
3.cmd合并ts保存成mp4格式
Python爬取下载m3u8视频,原来这么简单!相关推荐
- python爬取下载m3u8加密视频,原来这么简单!
1.前言 爬取视频的时候发现,现在的视频都是经过加密(m3u8),不再是mp4或者avi链接直接在网页显示,都是经过加密形成ts文件分段进行播放. 今天就教大家如果通过python爬取下载m3u8加密 ...
- python爬取网站m3u8视频,将ts解密成mp4,合并成整体视频
一些网站会提供m3u8视频地址,以供下载观看.或者一些网站经过分析后发现是使用m3u8格式进行播放的,这时使用m3u8的地址链接就可以下载到相应的视频. 一.关于m3u8:(https://blog. ...
- python爬取抖音用户数据_使用python爬取抖音视频列表信息
如果看到特别感兴趣的抖音vlogger的视频,想全部dump下来,如何操作呢?下面介绍介绍如何使用python导出特定用户所有视频信息 抓包分析 Chrome Deveploer Tools Chro ...
- 使用python爬取最右视频
最近学习了python,在此记录一下用python爬取最右视频 首先安装mitmproxy,安装方式:pip install mitmproxy 因为我使用的是Windows系统,无法使用mitmpr ...
- python爬取b站评论_学习笔记(1):写了个python爬取B站视频评论的程序
学习笔记(1):写了个python爬取B站视频评论的程序 import requests import json import os table='fZodR9XQDSUm21yCkr6zBqiveY ...
- python爬取bilibili弹幕_用Python爬取B站视频弹幕
原标题:用Python爬取B站视频弹幕 via:菜J学Python 众所周知,弹幕,即在网络上观看视频时弹出的评论性字幕.不知道大家看视频的时候会不会点开弹幕,于我而言,弹幕是视频内容的良好补充,是一 ...
- python爬b站评论_学习笔记(1):写了个python爬取B站视频评论的程序
学习笔记(1):写了个python爬取B站视频评论的程序 import requests import json import os table='fZodR9XQDSUm21yCkr6zBqiveY ...
- python爬取腾讯视频会员V力值
python爬取腾讯视频会员V力值 练练手,只需要将cookies改成自己的 便即可运行. from bs4 import BeautifulSoup import requests import r ...
- python爬取腾讯视频弹幕_用Python爬取腾讯视频弹幕
原标题:用Python爬取腾讯视频弹幕 via:菜J学Python 1.网页分析 本文以爬取<脱口秀大会 第3季>最后一期视频弹幕为例,首先通过以下步骤找到存放弹幕的真实url. 通过删减 ...
- 如何用python爬取数据_如何使用python爬取知乎数据并做简单分析
原标题:如何使用python爬取知乎数据并做简单分析 一.使用的技术栈: 爬虫:python27 +requests+json+bs4+time 分析工具: ELK套件 开发工具:pycharm 数据 ...
最新文章
- 并发编程-08安全发布对象之发布与逸出
- linux支持sshd救援模式,单用户、救援模式、克隆、两机互联
- oracle-group by -having
- 【6】C++语法与数据结构之STL_list学生管理系统_链表外排序_函数指针
- 【JS 逆向百例】网洛者反爬练习平台第六题:JS 加密,环境模拟检测
- 我的考研~~~3-4月份总结
- 用Java发起HTTP请求与获取状态码(含状态码列表)
- 汉诺塔问题的c语言递归
- 网页爬虫工具BeautifulSoup使用总结
- 数字图像处理matlab蔡利梅,数字图像处理:使用MATLAB分析与实现:using MATLAB
- lammps计算聚合物例子_lammps计算金属扩散
- 大数据整合方案架构总结
- 移动通信网中的密码算法演进之完整性保护
- PMBOK(第六版) PMP笔记——《十三》第十三章(项目干系人管理)
- 用Python爬取B站弹幕并做成词云
- windows下服务器的数据的迁移解决方案
- 微小宝公众号排行榜_公众号排名 | 2020年2月公众号地区排行榜重磅发布
- 洛谷2336 BZOJ2754 SCOI2012 喵星球上的点名 SA 莫队 二分
- 工业4.0 资产管理壳学习笔记( 5) 模型中的语义,概念和字典
- 工业互联网的破局之道:存储资源盘活系统
热门文章
- speedoffice(Excel)图片上怎么添加文字
- html 半个字符,半角字符什么意思
- 剑指 Offer II 028. 展平多级双向链表
- 【子衿技术】DBA进阶之路
- 到了2017还在苦等房价下跌的人,你们可以醒醒了!
- 微信小程序长列表优化方案
- 全网最详细的Intel CPU体系结构分析(内核源码)
- H3C路由器多出口NQA+TRACK实现冗余
- php 数独计算器,问题描述:数独(Sudoku)是一款大众喜爱的数字逻辑游戏。玩家需要根据9X9盘面上的已知数字_题来了...
- 博物馆沉浸式体验如何彰显文化价值