大家好,我是烤鸭:

之前玩爬虫的时候,看到过video标签中src属性引入的blob:http:xxxx,当时没找到解决思路,今天又遇到类似问题,就试着找了一下。

这是有人问过 https://vimeo.com/ 这个网站的视频怎么下载。
      https://superuser.com/questions/1033563/how-to-download-video-with-blob-url?answertab=votes

1.   分析

以这个网址为例:
https://open.gaodun.com/%E5%90%8D%E5%AE%B6%E8%AE%B2%E5%9D%9B/21.html

看video标签中的src属性,发现
src="blob:https://open.gaodun.com/b9d3366f-87ef-4328-9d97-31110de519a1"

复制这个地址去浏览器什么也找不到。

2.   找真实地址

不管上面的问题。先去看一下视频到底从哪来的。以谷歌浏览器为例,选择XHR,发现加载了m3u8文件。

m3u8是一种视频格式,看response中返回的.ts文件,直接复制ts文件的路径打开,就是视频片段。

到这,文件其实已经找到了。但是video中的blob:https://xxxx是什么呢,是怎么找到的文件。
这篇文章给了解释。
        https://blog.csdn.net/xingyun89114/article/details/80699527
简单来说就是视频对象做了个标记,src指向的是标记。

3.     找关联

当我对着源码和请求的response对照的时候,发现播放器周围的html标签都是后生成的,找到了一个比较“可疑”的js文件。

发现播放器代码附近的:

<div class="playDiv" id="divid"> <script type="text/javascript" src="https://s.gaodun.com/web/static-player/loader.js?13p9Wv580v1a!!fs-3"></script> </div>

看了js的源码,再跟了下debug。

找到了这个网页请求的m3u8地址是这个:https://vod.gaodun.com/13p9Wv580v1a!!fs/SD/1.m3u8。

直接浏览器访问就可以获取,就可以获取ts文件。ts文件就是一段段的视频,可以下载下来之后拼接成一个完整的文件。

4.     总结

至此,关于video 标签 src 带有blob:http的 抓取的就写完了。但是每个网站的情况都不一样。

这里只是提供一种思路,比如刚开始写的 https://vimeo.com/ 这个网站就不是js,而是json里边包含的视频地址。

欢迎有想法的朋友多交流。

爬虫,关于 video 标签 src 带有blob:http的 一些想法相关推荐

  1. 关于视频的链接src带有blob:http的视频如何下载的问题

    目录 前言 解决方案 前言 在爬虫的时候,想要爬一些视频下来参考学习,会发现有一些网站提供的视频链接打不开,或是是404, 比如某网站选中视频元素,发现视频链接是这样 <video id=&qu ...

  2. 关于Video Src 带有 blob:http的视频如何下载

    文章目录 1.利用Chrome 浏览器插件 2.第二种方法 找到 `m38u` 文件, 使用 `window `下载工具 `M3U8下载工具` 3.审查 下载的 JS 资源: 我们如果使用爬虫,想爬取 ...

  3. 用 chrome + excel + VBA + XMLHTTP 爬视频网站 video 标签中的 blob:http m3u8 视频资源,ffmpeg 拼接资源

    目录 一.准备 二.实干 三.等待 四.拼接 五.观影及xls工程下载 刚刚看了一个视频网站的资源,用 chrome 分析 Network 部分,发现其使用的也是 m3u8 格式 (Html源码图) ...

  4. js修改video的source_利用 javascript MediaSource 将 HTML video标签的src转成加载blob

    目前很多视频网站都是采用video标签形式,src是blob://http开头,效果如下 实现方式,用用H5的MediaSource方法 blob var video = document.query ...

  5. html网站video标签blob视频如何下载

    在淘宝或tdtu知乎等有时想下载里面的视频资源,看了一下视频标签里的video不是MP4格式url,而是blob+url的方式. 是blob:https并不是一种协议,而是html5中blob对象在赋 ...

  6. vue中通过数据双向绑定给video标签的src赋值,只有第一次有效,怎么解决?

    场景:在一个视频列表页面,点击视频列表,则全屏播放视频.全屏播放是一个公用组件,每次点击视频列表则把该视频的播放地址通过vue的数据双向绑定到组件中的video标签,如下: <video con ...

  7. 问题:动态变换video标签source的src不起作用

    如题 参考https://blog.csdn.net/weixin_42519137/article/details/85159900 <div id="video" cla ...

  8. 视频网站中video标签中blob:http

    视频网站中video标签中blob:http 一.问题场景 想下载知乎视频资源,却发现视频链接是这个样子的 blob:https://v.vzuu.com/b6146956-6e52-406d-890 ...

  9. 如何下载视频网站中video标签中的视频资源以blob:http开头的地址的资源

    一.问题场景 想下载知乎视频资源,却发现视频链接是这个样子的 blob:https://v.vzuu.com/b6146956-6e52-406d-8909-f3f1b81ae461 当时一脸懵比啊  ...

最新文章

  1. 一文快速入门分库分表中间件 Sharding-JDBC (必修课)
  2. 简明 Python 编程规范
  3. SAPCAR的简易使用方法
  4. Leetcode:169. 求众数
  5. NetworkComms V3 之支持TCP连接和UDP连接
  6. P5055 【模板】可持久化文艺平衡树
  7. @Scheduled cron表达式
  8. 常用 Dos 命令+杂项-常用的命令符+常用的公式
  9. 如何将原生PDF转为纯图像Word?
  10. mysql文件后缀名是什么_数据库文件的扩展名是什么?
  11. 呼呼呼呼呼呼呼呼呼好
  12. IEEE latex 编写lemma
  13. 京东到家开放平台网关系统设计实践
  14. 阿里云OCR通用文字识别和自定义模板OCR识别Python代码及一站式教程
  15. 淘宝人群拖价怎么做? 大神导航,一个神奇的网站,从此开启大神之路!
  16. Java中基本数据类型和引用数据类型存放的位置(栈内存和堆内存)
  17. TQ2440 学习笔记—— 3、如何在ubuntu 9.10 下安装vmware-tools?
  18. apache的url重写
  19. Javascript ES6(一)
  20. 解决VMware Workstation 与 Hyper-V 不兼容。请先从系统中移除 Hyper-V 角色,然后再运行 VMware Workstation。

热门文章

  1. [css] 你知道什么是面向对象的css(oocss)吗?有没有实践过?
  2. [css] 判断如下边框的颜色,并解释为什么[代码]?
  3. 工作107:静态路由
  4. 前端学习(1641):前端系列实战课程之js的组成部分
  5. 前端学习(1041):todolist--html界面
  6. 前端学习(493):script之延迟脚本和异步脚本
  7. 前端学习(172):格式化文本
  8. 顶宽的div中的英文不能自动换行
  9. python技巧(1)--如何转换itertools.chain对象为数组
  10. fibonacci数列前20项_高考数学二级结论——数列部分