目标网站:https://www.88ys.cc/vod-play-id-58547-src-1-num-1.html 反贪风暴4

对电影进行分析

我们发现,电影是按片段一点点加载出来的,我们分别抓取所有ts文件,然后合并成一个完整的文件即可下载到完整电影

代码如下:

# https://www.88ys.cc/vod-play-id-58547-src-1-num-1.html 电影地址

import requests

import os

import time

from multiprocessing import Pool

def run(i):

url = 'https://cn1.chinapellets.com/hls/20190406/ae64c4b38a00fb989546672c7d75c660/1554536039/film_0%04d.ts'%i

print("开始下载:"+url)

headers = {"User-Agent": "Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.92 Safari/537.36"}

r = requests.get(url, headers = headers)

# print(r.content)

with open('./mp4/{}'.format(url[-10:]),'wb') as f:

f.write(r.content)

def merge(t,cmd):

time.sleep(t)

res=os.popen(cmd)

print(res.read())

if __name__ == '__main__':

# 创建进程池,执行10个任务

pool = Pool(10)

for i in range(2790):

pool.apply_async(run, (i,)) #执行任务

pool.close()

pool.join()

#调用合并

merge(5,"copy /b mp4\\*.ts mp4\\new.mp4")

print('ok!处理完成')

因为单个进程下载太慢了,这里用到了进程池,这样基本达到了,最大网速

运行过程:

下载完成:

python下载电影视频_python爬虫:抓取下载电影文件,合并ts文件为完整视频相关推荐

  1. python基金预测分析_Python爬虫抓取基金数据分析、预测系统设计与实现

    版权声明:本文为博主原创文章,如果转载请给出原文链接:http://doofuu.com/article/4156231.html 目前在开发一款基于Python的基金爬取.分析.预测系统,目前已经开 ...

  2. python唐诗分析综合_Python爬虫抓取唐诗宋词

    一 说明 Python语言的爬虫开发相对于其他编程语言是极其高校的,在上一篇文章 爬虫抓取博客园前10页标题带有Python关键字(不区分大小写) 的文章中,我们介绍了使用requests做爬虫开发, ...

  3. python b站 排行_Python爬虫抓取B站小视频排行榜,新手也可以跟着做哦!

    Python爬虫学到什么程度就可以去找工作了? 有朋友在群里和大家讨论,问的最多的问题就是,python 爬虫学到什么程度可以去找工作了,关于这点,和大家分享下我的理解. 看大牛用Python实现发送 ...

  4. 编写Python爬虫抓取豆瓣电影TOP100及用户头像的方法

    这篇文章主要介绍了编写Python爬虫抓取豆瓣电影TOP100及用户头像的方法,用到了Python的urllib和urllib2模块,需要的朋友可以参考下 抓取豆瓣电影TOP100 一.分析豆瓣top ...

  5. 【python教程入门学习】Python爬虫抓取猫眼电影排行榜

    本节使用 Python 爬虫抓取猫眼电影网 TOP100 排行榜(https://maoyan.com/board/4)影片信息,包括电影名称.上映时间.主演信息. 在开始编写程序之前,首先要确定页面 ...

  6. python爬虫多url_Python爬虫抓取多个URL写入本地文件

    Python爬虫抓取多个URL写入本地文件!1. Pycharm中运行Scrapy windows环境下cmd中通过scrapy startproject 项目名,创建scrapy项目 修改Run-中 ...

  7. Python进阶之Scrapy-redis分布式爬虫抓取当当图书

    Python进阶之Scrapy-redis分布式爬虫抓取当当图书 1. 准备工作 1.1 安装scrapy-redis 1.2 在windows安装redis程序 1.3 打开redis服务 2. 需 ...

  8. python爬虫资源大全_Python爬虫抓取纯静态网站及其资源(基础篇)

    本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理 以下文章来源于腾讯云 作者:程序员宝库 **( 想要学习Python?Python ...

  9. python抓取数据库数据_Python爬虫抓取东方财富网股票数据并实现MySQL数据库存储...

    Python爬虫可以说是好玩又好用了.现想利用Python爬取网页股票数据保存到本地csv数据文件中,同时想把股票数据保存到MySQL数据库中.需求有了,剩下的就是实现了. 在开始之前,保证已经安装好 ...

  10. python爬虫实现股票数据存储_Python爬虫抓取东方财富网股票数据并实现MySQL数据库存储!...

    Python爬虫可以说是好玩又好用了.现想利用Python爬取网页股票数据保存到本地csv数据文件中,同时想把股票数据保存到MySQL数据库中.需求有了,剩下的就是实现了. 在开始之前,保证已经安装好 ...

最新文章

  1. Windows内核新手上路2——挂钩shadow SSDT
  2. echarts 在两点之间画一条线_凭什么?辛辛苦苦画了三个小时,却换来一句“撕了重画”...
  3. AngularJS Select(选择框)
  4. 人工智能 | 自动驾驶与人工智能前沿研究报告(概念篇)
  5. PHP/AJAX——登录页面与登录信息提示(非安全版本)
  6. 为什么开不了4g网络_为什么4G网络越来越慢?究竟是你手机出了问题还是网络原因?...
  7. Flink Forward Global 2021 议题征集ing!
  8. 小新pro13睡眠后无法唤醒_轻薄的外表狂野的心——联想小新 Pro13 测评
  9. c语言有啥简单的小程序,c语言-简单小程序-简单算法
  10. oracle锁类型tx,Oracle中的锁类型
  11. LFW pairs.txt解释
  12. ctfmon是什么启动项_win7启动项没有ctfmon.exe的解决方法
  13. 深度去除WinRAR广告
  14. PNP型三极管是不是要发射极接正电压,基极和集电极接地才能工作?能给张图不?
  15. 3个千兆WAN口和24个千兆交换LAN口,电信级高稳定性安全路由
  16. 修复win7开机很丑
  17. jeesite代码生成器的使用(初学者)
  18. freemarker(FTL)常见语法大全
  19. Fastadmin 阿里云Oss插件的配置
  20. 苹果手机!!!全民K歌如何下载发布的歌曲

热门文章

  1. 趣味编程故事|java进程占用cpu过高怎么办,别急我来帮你
  2. 睡觉也在爬虫之二(爬一组图片)
  3. 解决el-checkbox选中状态更改问题
  4. 网站被黑有什么影响?为什么网站被黑了?如何防止网站被黑?
  5. 华为路由器:WLAN直连式三层组网实验
  6. SAR图像相干斑滤波算法
  7. 论文编辑与投稿——引用文献(References)中作者名字中“姓”、“名”应该如何组织
  8. postgis+geoserver+openlayers最短路径分析-学习记录bug
  9. SAP CO11N/CO15工单报工BADI增强出口(保存前、保存后、数据验证)
  10. jsp高校教学资源管理系统