本人python运行环境:
IDE丨pycharm2.3
版本丨Python3.6
系统丨Windows 10
爬虫目的与思路:
实现目的与思路:
目的:
实现对电影目标url的解析与下载,由于第三方vip解析,只提供在线观看,隐藏想实现对目标视频的下载。
思路:
1.在百度搜索全名解析得到解析网站:jx.618g.com?/url=[电影播放地址]。
2.首先拿到想要看的电影url,通过第三方vip视频解析网站进行解析。
3.通过抓包,模拟浏览器发送正常请求。
4.通过拿到缓存ts文件,下载视频ts文件。
5.最后通过转换为mp4文件,即可实现正常播放。
主要代码:

import requests
from multiprocessing import Pool
def download(i):url = 'https://vip.okokbo.com/20180319/FITtZ17w/1000kb/hls/OdGD6663%03d.ts' % iprint(url)r = requests.get(url)ret = r.contentwith open('./kankan/{}'.format(url[-11:]),'wb') as f:f.write(ret)if __name__ == '__main__':pool = Pool(15)for i in range(10):pool.apply_async(download, args=(i, ))pool.close()pool.join()

总结:
1.视频缓存ts文件这里都是一些缓存视频文件,每个只有几秒钟播放,最后需要合并成一个mp4格式的视频,就可以正常播放,默认高清下载。
2.注意这里的进度因为使用多进程下载,进度仅供参考,没有确切显示进度,可以进文件夹查看正常进度,可以理解为显示一次进度,下载一个ts文件。
3.ts文件下载完后,在命令提示符中用copy /b *.ts [填写你下载的文件名] .mp4。
特别说明如果哪里有问题请及时指出来,欢迎大家指正错误,此爬虫项目只用于入门,请不要用其盈利。否则,后果自负!!!

Python爬虫实现电影资源下载方法相关推荐

  1. 全网最全python爬虫+数据分析资源整理

    4.29(第二天) 开篇词 你为什么需要数据分析能力? 第一模块:数据分析基础篇 (16讲) 01丨数据分析全景图及修炼指南 02丨学习数据挖掘的最佳路径是什么? 03丨Python基础语法:开始你的 ...

  2. Python爬虫——利用Scrapy批量下载图片

    Python爬虫--利用Scrapy批量下载图片 Scrapy下载图片项目介绍 使用Scrapy下载图片 项目创建 项目预览 创建爬虫文件 项目组件介绍 Scrapy爬虫流程介绍 页面结构分析 定义I ...

  3. 教你使用Python爬虫获取电子书资源实战!喜欢学习的小伙伴过来看啦!

    最近在学习Python,相对java来说python简单易学.语法简单,工具丰富,开箱即用,适用面广做全栈开发那是极好的,对于小型应用的开发,虽然运行效率慢点,但开发效率极高.大大提高了咱们的生产力. ...

  4. Python爬虫—Scrapy框架—Win10下载安装

    Python爬虫-Scrapy框架-Win10下载安装 1. 下载wheel 2.下载twisted 3. 下载pywin32 4. 下载安装Scrapy 5. 创建一个scrapy项目 6. fir ...

  5. python爬虫—豆瓣电影海报(按类别)

    原文地址:http://www.alannah.cn/2019/04/06/getdouban/ python爬虫-豆瓣电影海报 目标:通过python爬虫在豆瓣电影上按类别对电影海报等数据进行抓取, ...

  6. Python爬虫获取电子书资源实战

    最近在学习Python,相对java来说python简单易学.语法简单,工具丰富,开箱即用,适用面广做全栈开发那是极好的,对于小型应用的开发,虽然运行效率慢点,但开发效率极高.大大提高了咱们的生产力. ...

  7. Python爬虫——Selenium 简介和下载

    文章目录 Python爬虫--Selenium 简介和下载 1.Selenium 简介 2.Selenium 下载安装 3.Selenium 简单使用 Python爬虫--Selenium 简介和下载 ...

  8. python爬虫详细步骤-Python爬虫的两套解析方法和四种爬虫实现过程

    对于大多数朋友而言,爬虫绝对是学习 python 的最好的起手和入门方式.因为爬虫思维模式固定,编程模式也相对简单,一般在细节处理上积累一些经验都可以成功入门.本文想针对某一网页对 python 基础 ...

  9. [python爬虫] Selenium常见元素定位方法和操作的学习介绍(转载)

    转载地址:[python爬虫] Selenium常见元素定位方法和操作的学习介绍 一. 定位元素方法 官网地址:http://selenium-python.readthedocs.org/locat ...

最新文章

  1. shell监控MySQL服务是否正常
  2. CentOS系统更换软件安装源yum
  3. 计算机视觉的发展现状
  4. 为什么 if else 不是好代码?
  5. python3的float数精度_Python3 - 执行精确的浮点数运算
  6. PAT (Advanced Level) 1017 Queueing at Bank(模拟)
  7. Aupera:FPGA让视频编码与AI结合水到渠成
  8. i2c总线注意事项和在linux下使用实战
  9. Mac上最佳的SVN管理工具:Cornerstone
  10. 华为鸿蒙将比安卓快,任正非透露华为鸿蒙系统:将比安卓速度快60%
  11. java区块作用域_ES6-let、const和块级作用域
  12. 【原创】自己动手写控件----XSmartNote控件
  13. C/C++[sort( )]排序
  14. torch.FloatTensor和torch.Tensor、torch.tensor
  15. python过去电脑网关不可用怎么办_电脑默认网关不可用怎么解决 Win7系统默认网关不可用终极解决方法...
  16. 域名注册、域名实名认证、域名解析流程详解
  17. win32Day06:控件
  18. 线下沙龙:靠谱的区块链应用到底是啥样?
  19. 各种图片、文字无缝滚动
  20. PR菜鸟入门 -- PR基础教学

热门文章

  1. Support for password authentication was removed on August 13, 2021.解决办法大全
  2. redis 常用监控指标
  3. 卡尔曼滤波 预测与测量我们更应该相信谁?
  4. 关于真机调试DDMS中的data文件夹打不开的解决方法
  5. 央视:乐视网是创业失败还是涉嫌欺诈?
  6. Spark Release 2.0.0发版概序
  7. FMM 快速行进法(一)
  8. 惊天消息!美国重启病毒实验,或对人类造成巨大威胁
  9. 32位系统能够识别多达内存_C ++程序可打印多达N个术语的卢卡斯系列
  10. 在STM32中:CAN总线驱动