python如何把ts视频拼接起来_Python爬取网站m3u8视频,将ts解密成mp4,合并成整体视频...
前言
本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理。
今天群里面有一个小伙伴发了一个链接,出于好奇,点击去看了一下,然后确定试试看。
基本开发环境Python 3.6
Pycharm
相关模块的使用
目标网页分析
根据小伙伴提供的地址,是关于火影博人传的。
使用开发者工具的时候发现,有现成的mp4地址,当心里面还在想着:
< 嗯?就这?>
复制链接就自动下载了,点开一看........
怎么是这个东西,回头一看网页,原来是广告的视频 = =
再分析
1、视频获取多个ts文件
其实网站的视频数据是分为了 一个一个的TS文件,而且这些TS文件都在m3u8的链接当中。每一个ts文件链接,都是对应视频中的一个片段,整个视频就是又一个一个片段组合成。
既然知道了视频的来源,那么我们就要找到m3u8 地址的来源,并分析规律,这样才能批量爬取ts文件数据。当然如果你m3u8的url地址,也可以用一些专门的软件,可以直接下载并合成视频。
2、获取m3u8 的url地址
通过两个链接的对比,可以发现有一个日期不一样,还有一个应该就是类似ID的参数不一样,想要找到来源,可以复制 1556_fd900088 一个关键参数,在开发者工具当中搜索。
这个链接包含的参数:
根据导航栏中的url可以发现:
ID:95 对应的应该是 博人传这个动漫的ID
pid:175对应的应该就是多少集
后面两个参数的都没有传值的,复制url地址,删除后面两个参数一样可以访问,说明这个两个参数没有什么特别大的影响。
3、下载保存合并成mp4文件
先把每个ts文件都保存下来。
简单的合并成mp4文件:
电脑一般都自带安装了WinRaR解压软件,全选ts文件后右键选择添加到压缩文件,看下图界面,
注意1:压缩文件名后缀要改成.MP4,
注意2:压缩方式选择为存储,默认是标准是不行的。
注意点:
这样合并的前提是你的ts文件都是0000,然后0001 这样按照顺序排列的,不然你合并出来之后播放顺序是错乱的。
如果下载的ts文件不是这样排序的情况,需要保存整个m3u8链接中的数据。然后通过cmd命令的方式将所有的ts合并成一个文件:
copy /b d:\xxx\download_ts\*.ts d:\xxx\download_ts\new.mp4
也可以使用代码用FFmpg合并,之前爬去B站视频合并音频数据和视频画面的工具。
python如何把ts视频拼接起来_Python爬取网站m3u8视频,将ts解密成mp4,合并成整体视频...相关推荐
- python怎么爬取电影海报_Python 爬取猫眼数据分析《无名之辈》为何能逆袭成黑马?...
原标题:Python 爬取猫眼数据分析<无名之辈>为何能逆袭成黑马? 作者 | 罗昭成 责编 | 唐小引 出品 | CSDN(ID:CSDNNews) 最近几天,有部国产电影因好评及口碑传 ...
- python爬取整个网站_python爬取网站全部url链接
御剑自带了字典,主要是分析字典中的网址是否存在,但是可能会漏掉一些关键的网址,于是前几天用python写了一个爬取网站全部链接的爬虫. 实现方法 主要的实现方法是循环,具体步骤看下图: 贴上代码: # ...
- python爬取视频的工具_Python爬取视频(其实是一篇福利)
原博文 2018-01-09 00:14 − 窗外下着小雨,作为单身程序员的我逛着逛着发现一篇好东西,来自知乎 你都用 Python 来做什么?的第一个高亮答案. 到上面去看了看,地址都是明文的,得, ...
- python 爬取视频真实地址_python 爬取视频
一.概述 爬取步骤 第一步:获取视频所在的网页 第二步:F12中找到视频真正所在的链接 第三步:获取链接并转换成机械语言 第四部:保存 二.分析视频链接 获取视频所在的网页 以酷6网为例,随便点击一个 ...
- python爬取网站新闻_Python爬取网站新闻
###准备### 本实例使用辅助工具Fiddler抓取网页数据和使用文档查看工具sublime正则过滤(也可使用其它文档编辑工具),python开发工具使用Pycharm编辑 我们选取搜狐网的新闻页面 ...
- python 制作网站教程_Python爬取网站博客教程并制作成PDF
要把教程变成PDF有三步: 1.先生成空html,爬取每一篇教程放进一个新生成的div,这样就生成了包含所有教程的html文件(BeautifulSoup) 2.将html转换成pdf(wkhtmlt ...
- python爬取虎扑评论_python爬取网站数据
编码问题 因为涉及到中文,所以必然地涉及到了编码的问题,这一次借这个机会算是彻底搞清楚了. 问题要从文字的编码讲起.原本的英文编码只有0~255,刚好是8位1个字节.为了表示各种不同的语言,自然要进行 ...
- python爬取网站四种姿势_python爬取网站数据四种姿势,你值得拥有~
前言 首先,分析来爬虫的思路:先在第一个网页(https://www.wikidata.org/w/index.php?title=Special:WhatLinksHere/Q5&limit ...
- python爬虫搜特定内容的论文_python爬取指定微信公众号文章
python怎么抓取微信阅清晨的阳光比不上你的一缕微笑那么动人,傍晚的彩霞比不上你的一声叹息那么心疼,你的一个个举动,一句句话语都给小编带来无尽的幸福. 抓取微信公众号的文章 一.思路分析 目前所知晓 ...
最新文章
- [教程]JS从糊涂到明白:一步一步编写计算器2 – 简化代码
- java ear war_[转] 基于Java的打包jar、war、ear包的作用与区别详解
- LeetCode Design TinyURL
- web 前端基本框架
- MongoDB学习笔记三:查询
- 12-- 缺失的第一个正数
- 10天学安卓-第二天
- 机器学习两大派别--南大周志华
- 51Nod-1182 完美字符串【排序+字符统计】
- C# Task.FromResult的用法
- SetupAPI简介与设备管理
- oracle11g oem使用手册,Oracle11g从入门到精通pdf
- .net分流抢票助手
- 2019 FeatherNets: Convolutional Neural Networks as Light as Feather for Face Anti-spoofing
- php 验证码数字英文的,验证码的英文_php 中英文验证码程序
- 最全面鸿蒙系统开发的相关资料收录
- 三极管与场效应管的区别与联系
- 通过Fiddler进行抓包并分析
- 每日文献:2018-01-10
- 华亭一中2021年高考成绩查询,华亭一中2019高考又传佳讯!