前言

本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理。

今天群里面有一个小伙伴发了一个链接,出于好奇,点击去看了一下,然后确定试试看。

基本开发环境Python 3.6

Pycharm

相关模块的使用

目标网页分析

根据小伙伴提供的地址,是关于火影博人传的。

使用开发者工具的时候发现,有现成的mp4地址,当心里面还在想着:

< 嗯?就这?>

复制链接就自动下载了,点开一看........

怎么是这个东西,回头一看网页,原来是广告的视频 = =

再分析

1、视频获取多个ts文件

其实网站的视频数据是分为了 一个一个的TS文件,而且这些TS文件都在m3u8的链接当中。每一个ts文件链接,都是对应视频中的一个片段,整个视频就是又一个一个片段组合成。

既然知道了视频的来源,那么我们就要找到m3u8 地址的来源,并分析规律,这样才能批量爬取ts文件数据。当然如果你m3u8的url地址,也可以用一些专门的软件,可以直接下载并合成视频。

2、获取m3u8 的url地址

通过两个链接的对比,可以发现有一个日期不一样,还有一个应该就是类似ID的参数不一样,想要找到来源,可以复制 1556_fd900088 一个关键参数,在开发者工具当中搜索。

这个链接包含的参数:

根据导航栏中的url可以发现:

ID:95 对应的应该是 博人传这个动漫的ID

pid:175对应的应该就是多少集

后面两个参数的都没有传值的,复制url地址,删除后面两个参数一样可以访问,说明这个两个参数没有什么特别大的影响。

3、下载保存合并成mp4文件

先把每个ts文件都保存下来。

简单的合并成mp4文件:

电脑一般都自带安装了WinRaR解压软件,全选ts文件后右键选择添加到压缩文件,看下图界面,

注意1:压缩文件名后缀要改成.MP4,

注意2:压缩方式选择为存储,默认是标准是不行的。

注意点:

这样合并的前提是你的ts文件都是0000,然后0001 这样按照顺序排列的,不然你合并出来之后播放顺序是错乱的。

如果下载的ts文件不是这样排序的情况,需要保存整个m3u8链接中的数据。然后通过cmd命令的方式将所有的ts合并成一个文件:

copy /b d:\xxx\download_ts\*.ts   d:\xxx\download_ts\new.mp4

也可以使用代码用FFmpg合并,之前爬去B站视频合并音频数据和视频画面的工具。

python如何把ts视频拼接起来_Python爬取网站m3u8视频,将ts解密成mp4,合并成整体视频...相关推荐

  1. python怎么爬取电影海报_Python 爬取猫眼数据分析《无名之辈》为何能逆袭成黑马?...

    原标题:Python 爬取猫眼数据分析<无名之辈>为何能逆袭成黑马? 作者 | 罗昭成 责编 | 唐小引 出品 | CSDN(ID:CSDNNews) 最近几天,有部国产电影因好评及口碑传 ...

  2. python爬取整个网站_python爬取网站全部url链接

    御剑自带了字典,主要是分析字典中的网址是否存在,但是可能会漏掉一些关键的网址,于是前几天用python写了一个爬取网站全部链接的爬虫. 实现方法 主要的实现方法是循环,具体步骤看下图: 贴上代码: # ...

  3. python爬取视频的工具_Python爬取视频(其实是一篇福利)

    原博文 2018-01-09 00:14 − 窗外下着小雨,作为单身程序员的我逛着逛着发现一篇好东西,来自知乎 你都用 Python 来做什么?的第一个高亮答案. 到上面去看了看,地址都是明文的,得, ...

  4. python 爬取视频真实地址_python 爬取视频

    一.概述 爬取步骤 第一步:获取视频所在的网页 第二步:F12中找到视频真正所在的链接 第三步:获取链接并转换成机械语言 第四部:保存 二.分析视频链接 获取视频所在的网页 以酷6网为例,随便点击一个 ...

  5. python爬取网站新闻_Python爬取网站新闻

    ###准备### 本实例使用辅助工具Fiddler抓取网页数据和使用文档查看工具sublime正则过滤(也可使用其它文档编辑工具),python开发工具使用Pycharm编辑 我们选取搜狐网的新闻页面 ...

  6. python 制作网站教程_Python爬取网站博客教程并制作成PDF

    要把教程变成PDF有三步: 1.先生成空html,爬取每一篇教程放进一个新生成的div,这样就生成了包含所有教程的html文件(BeautifulSoup) 2.将html转换成pdf(wkhtmlt ...

  7. python爬取虎扑评论_python爬取网站数据

    编码问题 因为涉及到中文,所以必然地涉及到了编码的问题,这一次借这个机会算是彻底搞清楚了. 问题要从文字的编码讲起.原本的英文编码只有0~255,刚好是8位1个字节.为了表示各种不同的语言,自然要进行 ...

  8. python爬取网站四种姿势_python爬取网站数据四种姿势,你值得拥有~

    前言 首先,分析来爬虫的思路:先在第一个网页(https://www.wikidata.org/w/index.php?title=Special:WhatLinksHere/Q5&limit ...

  9. python爬虫搜特定内容的论文_python爬取指定微信公众号文章

    python怎么抓取微信阅清晨的阳光比不上你的一缕微笑那么动人,傍晚的彩霞比不上你的一声叹息那么心疼,你的一个个举动,一句句话语都给小编带来无尽的幸福. 抓取微信公众号的文章 一.思路分析 目前所知晓 ...

最新文章

  1. [教程]JS从糊涂到明白:一步一步编写计算器2 – 简化代码
  2. java ear war_[转] 基于Java的打包jar、war、ear包的作用与区别详解
  3. LeetCode Design TinyURL
  4. web 前端基本框架
  5. MongoDB学习笔记三:查询
  6. 12-- 缺失的第一个正数
  7. 10天学安卓-第二天
  8. 机器学习两大派别--南大周志华
  9. 51Nod-1182 完美字符串【排序+字符统计】
  10. C# Task.FromResult的用法
  11. SetupAPI简介与设备管理
  12. oracle11g oem使用手册,Oracle11g从入门到精通pdf
  13. .net分流抢票助手
  14. 2019 FeatherNets: Convolutional Neural Networks as Light as Feather for Face Anti-spoofing
  15. php 验证码数字英文的,验证码的英文_php 中英文验证码程序
  16. 最全面鸿蒙系统开发的相关资料收录
  17. 三极管与场效应管的区别与联系
  18. 通过Fiddler进行抓包并分析
  19. 每日文献:2018-01-10
  20. 华亭一中2021年高考成绩查询,华亭一中2019高考又传佳讯!

热门文章

  1. 【NOI2006】 生日快乐
  2. RocketMq - Springboot2.x整合RocketMQ4.x - 发送消息(七)
  3. 西安交通大学915考研--编程题Java代码踩坑(2020年真题)
  4. ps aux 进程状态为 I (大写i)
  5. 青龙扩展--九章头条
  6. 海贼王最新漫画情报分析
  7. 基于数据库实现微服务动态路由
  8. lattice fpga ddr3 读写控制
  9. 个人物联网(目前用到了树莓派、PMS7003攀藤g7传感器、DHT11温湿度传感器)
  10. C语言实现物品竞拍管理系统