(干货分享)如何下载网站上的视频

本文将介绍一些网站上的视频的爬取方法,只涉及技术讨论,不提倡盗视频和侵犯版权等行为
使用环境为Chrome浏览器,Edge、360、QQ等套壳Chromium浏览器类似,FireFox也差不多

目录:

  1. 万能方法
  2. 简单爬取
  3. 复杂爬取
  4. 缓存法
  5. 总结

万能方法

录屏
录屏永远是最万能的,但是受局限于画质、帧率、和时间,并且不够Elegant

简单爬取

这种方法一般可以爬取几分钟内的短视频
以微信公众号内嵌视频为例,地址
点击播放视频,视频开始播放就可以暂停。右键点击视频,选择检查(或叫开发者……、网页检索……),如果没出现选项,就按F12键。然后按Ctrl+F打开搜索框,输入 <video ,然后按回车就会搜索网页内所有视频元素。如果出现多个视频,把光标移动到对应的标签,对应的视频就会高亮。然后查看我们想要的视频的<video>标签内容:

<video class="video_fill" webkit-playsinline="isiPhoneShowPlaysinline" playsinline="isiPhoneShowPlaysinline" origin_src="http://mpvideo.qpic.cn/0b786uabqaaa5iajlqu6bjqfb5oddd2qagaa.f10002.mp4?dis_k=f906c06ff946a5fea1ef11469bbbdffc&amp;dis_t=1622619176&amp;spec_id=MzA5NTgxNTQzMA%3D%3D1622619242&amp;vid=wxv_1869171124429701126&amp;format_id=10002" src="http://mpvideo.qpic.cn/0b786uabqaaa5iajlqu6bjqfb5oddd2qagaa.f10002.mp4?dis_k=f906c06ff946a5fea1ef11469bbbdffc&amp;dis_t=1622619176&amp;spec_id=MzA5NTgxNTQzMA%3D%3D1622619242&amp;vid=wxv_1869171124429701126&amp;format_id=10002&amp;support_redirect=1&amp;mmversion=false" preload="metadata">                     您的浏览器不支持 video 标签                </video>

标签的内容千变万化,但是我们需要的是src后面双引号包住的东西,即

src="http://mpvideo.qpic.cn/0b786uabqaaa5iajlqu6bjqfb5oddd2qagaa.f10002.mp4?dis_k=f906c06ff946a5fea1ef11469bbbdffc&amp;dis_t=1622619176&amp;spec_id=MzA5NTgxNTQzMA%3D%3D1622619242&amp;vid=wxv_1869171124429701126&amp;format_id=10002&amp;support_redirect=1&amp;mmversion=false"

这就是我们想要的视频的源地址,chrome打开这个地址,点击视频右下角的三个点按钮,就出现下载选项。至此简单爬取就完成了。

复杂爬取

这个方法适用于小型视频网站,这类网站并没有对视频进行保护。对于腾讯、爱奇艺、优酷等平台,这个方法依然不能用。
以下面这个网页为例:imeiju
首先用上面简单爬取方法,得到视频的源地址,发现是这样的:

src="blob:https://www.imeiju.io/98dcd5a3-dfb0-4759-bc05-e20b61cfe9f6"

跳转到https那个网址,一般情况下出现404。因为视频被分段,解析不到完整视频的源地址,但是浏览器会受到一个全部视频段落的名单,里面包括视频段落的地址和信息。所以操作方法是这样的:
chrome新建一个空白标签页,按F12打开开发者视图,选择NetWork标签,最好选中以下这两个选项,Chrome输入网页地址,然后回车跳转

点击播放视频,查看开发者视图NetWork标签,发现网页一直在下载文件,这就是视频分段文件,大部分情况下后缀是.ts,这里是.image,但是问题不大。在Filter(过滤器)内输入 .m3u8 ,然后过滤得到几个后缀为m3u8的文件,逐个点进去查看Preview,发现一个文件长的比较像

可以把其中一段下载下来验证一下,正确的话这个就是分段视频的清单。然后复制这个m3u8文件的地址

打开M3U8 Downloader,把M3U8文件地址复制进去,文件名、下载路径自选,文件类型选MP4,然后点击下载,等待下载完毕。软件会自动将分段视频全部下载并且合成为一个视频。

缓存法

理论上这个方法能够突破会员视频、代理等复杂限制下载视频,但是问题在于如何找到缓存。在这里只提供一个思路,在Chrome操作方法十分复杂,不作教学。
但是缓存法不止能够用在Chrome上,在安卓手机上,一些软件在观看视频后直接把文件缓存在本地而不加密,可以比较容易找到缓存从而得到视频文件。

总结

本文介绍了4个方法,如果需要下载腾讯、爱奇艺、优酷等平台的视频,上Github搜索对应关键词,一般情况是存在正在维护的视频下载脚本的(因为语言五花八门,问题在于会不会使用)。

(干货分享)如何下载网站上的视频相关推荐

  1. 教你如何简便下载网站上的视频

    教你如何简便下载网站上的视频 利用you-get可以下载的国外网站: 利用you-get可以下载的国内网站: 接下来就具体介绍如何下载: 一.下载视频 1.安装you-get 如果之前没装过you-g ...

  2. 如何下载网站上的视频,亲测有效

    You-get是GitHub上的一个项目,也可以说是一个命令行程序,帮助大家下载大多主流网站上的视频.图片及音频. 第一步:下载安装python3.7(最新) 第二步:按住键盘上的"win+ ...

  3. 如何使用python下载网站上的视频

    youtube-dl 从名字上也能看出来,是专门用来下载YouTube的视频. 不过本人对YouTube不感兴趣,但是这个模块可以用来下载bilibili上的视频我们就来试一试 首先pip insta ...

  4. 根据M3U8文件地址下载网站上的视频

    无聊自学爬虫,想追剧,找到了在线观看的网址,然后想有什么办法能把网站上播放的视频下载下来. 我的m3u8格式是这样的(链接已打码),用的AES128加密 #EXTM3U #EXT-X-VERSION: ...

  5. 视频网站上的视频下载工具

    http://www.vidown.cn/softdownload.html 这个叫维棠的视频下载软件真的很不错呢,可以直接下载视频网站上的视频, 本来想下载完就删掉的,但是没想到这么好用, 就留着吧 ...

  6. qfile超过下载文件容量_如何下载视频网站上的视频,这里有方法

    你是否在网上看到某个视频,非常喜欢,但是却苦于不知道如何将其下载下来.下面,我来给大家介绍一个好用的网站和软件. 这个网站软件叫 硕鼠,是一个专门下载网站视频和转换视频的网站和软件.下面我来介绍一下如 ...

  7. 一款Github工具包-快速下载网页上的视频

    导读:今天给大家推荐一款优秀的Github工具包,可以让您快速下载网页上的视频. You-get 项目主页:https://github.com/soimort/you-get/wiki/中文说明#i ...

  8. 怎么下载网页上的视频

    现在视频网站非常火爆,有时候看到一些精美的视频,我们都想下载下来,方便日后观看,但不懂电脑知识的人,就觉得非常难,其实,这些都是很简单的,下面我就一步一步教大家如何下载视频网站上的视频. 通用方法,所 ...

  9. html如何添加本地视频播放,怎样在网站上添加视频?-MetInfo帮助中心

    # 怎样在网站上添加视频? ### 一.哪些地方可以添加在线视频? 只要有编辑器的地方就可以进行添加,如:产品详细页面,文章详细页面,首页简介模块,案例详细页面等. ### 二.什么是编辑器?在后台哪 ...

  10. 【下载网页上的视频】IDM显示无法将下载行为传输到IDM

    安装了绿化版的IDM来下载网页上的视频,非常好用,但是下载之后却显示无法将下载行为传输到IDM. [解决办法]下载之前进行配置:运行IDM,下载-选项-常规下进行设置: 常规设置-勾选接管所有浏览器下 ...

最新文章

  1. linux nginx ssl 文件路径,linux – 如何将SSL证书从Apache服务器传输到NGINX服务器
  2. ASP.NET MVC区域
  3. 一切尽在掌控之中:这个Python脚本,让工作自动向你汇报进度!
  4. Matlab中用到的bsxfun函数
  5. 重大变动:OpenCV拟更改授权协议!
  6. Windows启动管理器
  7. 尴尬了!迪士尼官方声明:从未与VIPKID有任何层面的业务合作关系
  8. LettCode50. Pow(x, n)
  9. 大小仅17KB!这个微型风格迁移模型太好玩了 | 代码+教程
  10. WEBPACK+ES6+REACT入门(1/7)-创建webpack4.x项目
  11. 交易结算金额一致性保证
  12. 植物野外识别速查图鉴
  13. calcite解读专栏前言
  14. 美颜sdk动态贴纸是什么?
  15. 扫盲:云计算、大数据和人工智能
  16. ZipEntry实现文件解压缩与目录解压缩
  17. ftpclient查看服务器文件,使用Apache FtpClient在FTP服务器中计算文件校验和
  18. NOI2019 游记
  19. %CRYPTO-4-RECVD_PKT_INV_SPI: decaps: rec'd IPSEC packet has invalid spi 解法方法
  20. java g1的并行_「g1」JVM G1详解 - seo实验室

热门文章

  1. 线性代数Python计算:矩阵对角化
  2. jquery stop()方法的讲解使用
  3. MAMP(win) Apache启动失败__句柄无效。 : master_main: create child process failed. Exiting.
  4. Windows平台好用但小众软件推荐
  5. cuba-platform和jmix框架
  6. 小学教资——教育教学口诀
  7. JavaScript如何运行
  8. linux 三网卡 双网关,三网卡双机互联共享Internet
  9. android 自定义 对号,超简单实现Android自定义Toast
  10. 2021-09-10ESSM, CVR预估到底要预估什么