文章目录

  • python爬虫--爬取91看剧网电视剧
    • 爬取视频必备知识
    • 思路
    • 代码
    • 合并视频

python爬虫–爬取91看剧网电视剧

爬取视频必备知识

https://www.91kanju.com/vod-play/54812-1-2.html

思路

查看网页源代码;发现m3u8的URL


找到ts文件存在的位置:

代码

import requests
import re
#
# obj = re.compile(r"url: '(?P<url>.*?)',",re.S)
# url = 'https://www.91kanju.com/vod-play/54812-1-2.html'
#
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.105 Safari/537.36'}
#
# resp = requests.get(url=url,headers=headers).text
#
# m3u8_url = obj.search(resp).group("url")
#
# print(m3u8_url)
#
# #下载m3u8文件
#
# resp2 = requests.get(url=m3u8_url,headers=headers)
# with open("哲仁王后.m3u8",mode='wb') as fp:
#     fp.write(resp2.content)
#本地缓存到m3u8文件后将上面注释掉
n = 1
with open("哲仁王后.m3u8",mode='r',encoding='utf-8') as fp:for line in fp:line = line.strip()if line.startswith("#"):continueif n<10:temp = '0' + '0' + str(n)elif 10<=n<100:temp = '0' + str(n)resp3 = requests.get(url=line,headers=headers)f = open(f"video/{temp}.ts",mode='wb')f.write(resp3.content)f.close()resp3.close()n+=1print(temp)


合并视频

可以使用第三方软件。片段少的话可以使用window自带的合并功能。
打开CMD

例子:
copy/b D:\video\*.ts  D:\new.mp4

python爬虫--爬取9某1看剧网电视剧相关推荐

  1. python爬虫爬取网页新闻标题-看完保证你会

    python爬虫爬取网页新闻标题方法 1.首先使用浏览自带的工具--检查,查找网页新闻标题对应的元素位置,这里查到的新闻标题是在 h3 标签中 2.然后使用编辑器编写python代码 2.1方法一: ...

  2. Python爬虫-爬取快看漫画网图片并拼接成漫画长图

    Python爬虫-爬取快看漫画网图片并拼接成漫画长图 1.爬取图片 2.拼接图片 1.爬取图片 import os import requests from bs4 import BeautifulS ...

  3. python爬虫数据分析可以做什么-python爬虫爬取的数据可以做什么

    在Python中连接到多播服务器问题,怎么解决你把redirect关闭就可以了.在send时,加上参数allow_redirects=False 通常每个浏览器都会设置redirect的次数.如果re ...

  4. python网易云_用python爬虫爬取网易云音乐

    标签: 使用python爬虫爬取网易云音乐 需要使用的模块 只需要requests模块和os模块即可 开始工作 先去网易云音乐网页版找一下你想要听的歌曲点击进去.按键盘F12打开网页调试工具,点击Ne ...

  5. python如何爬取网站所有目录_用python爬虫爬取网站的章节目录及其网址

    认识爬虫 网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本.另外一些不常使用的名字还有蚂蚁.自动索引.模拟 ...

  6. 简单python爬虫爬取游戏wiki立绘

    简单python爬虫爬取游戏wiki立绘 玩二次元手游是感叹美少女立绘真好看啊,可惜就是抽不到,于是看到b站wiki上有角色立绘,就写了个爬虫准备将立绘趴下来欣赏(舔). 本人爬虫的技术只算是初学,代 ...

  7. Python爬虫---爬取腾讯动漫全站漫画

    Python爬虫---爬取腾讯动漫全站漫画 操作环境 网页分析 明确目标 提取漫画地址 提取漫画章节地址 提取漫画图片 编写代码 导入需要的模块 获取漫画地址 提取漫画的内容页 提取章节名 获取漫画源 ...

  8. Python爬虫 爬取豆瓣电影TOP250

    Python爬虫 爬取豆瓣电影TOP250 最近在b站上学习了一下python的爬虫,实践爬取豆瓣的电影top250,现在对这两天的学习进行一下总结 主要分为三步: 爬取豆瓣top250的网页,并通过 ...

  9. python爬虫----爬取网易云音乐

    使用python爬虫爬取网易云音乐 目录 使用python爬虫爬取网易云音乐 需要使用的模块 开始工作 运行结果 需要使用的模块 只需要requests模块和os模块即可 开始工作 先去网易云音乐网页 ...

最新文章

  1. 深入了解Oracle前滚恢复rolling forward(一)
  2. amd cpu 不兼容centos5.5_AMD放弃兼容性?这事简单也不简单
  3. 重写(override / overwrite)
  4. 与JBoss Fuse,Jenkins和Nexus的持续集成
  5. 黑客攻防技术宝典web实战篇:攻击应用程序逻辑习题
  6. 【GWT系列】实现远程过程调用
  7. kafka实现组内广播
  8. win11开始菜单如何分组 Windows11开始菜单进行分组的设置方法
  9. 《过程控制系统》习题整理
  10. cad完全卸载教程_如何完全卸载(删除)cad-百度经验
  11. 41.朴素贝叶斯Naive Bayes公式推导与理解+求解公园凉鞋问题(借助文氏图)
  12. net_speeder发双倍包加速
  13. ROS学习记录16【SLAM】仿真学习5——将cmd_vel转换为ackman小车的速度
  14. IC Nansha|AMD高级副总裁、大中华区总裁潘晓明:制程、架构、平台优化突破计算边界
  15. 什么是法?什么是僧?
  16. 鸿蒙系统为万物互联而生,鸿蒙系统发布:万物互联 EMUI10同台上场
  17. 如何验证JDK已安装好,环境变量已配置成功
  18. 破解xp局域网共享限制(XP自由设置共享用户数方法)
  19. 基于springboot的高校社团管理系统
  20. 向左转移测试需要团队的努力

热门文章

  1. python参考文献及其出版社_参考文献查重-Python
  2. Idea的快捷功能使用统计
  3. 【mac m1 paddleOCR】安装环境及其坑位
  4. python猜大小游戏,Python实现的摇骰子猜大小功能小游戏示例
  5. [OpenCV] CV_32F与CV_8U之间的数据类型转换
  6. RHCE(四)SAMBA协议
  7. 3D点集之间计算转移矩阵,旋转R,转移T,新增缩放s (总结全面)
  8. 计算机二级msoffice选择题知识,2017计算机二级MSoffice选择题练习(含答案)
  9. 完美解决64位操作系统配置 php无法加载mysql模块问题
  10. python中的美元符号_类似美元$这个符号pyCharm2.0里怎么输入不好用呢,美元pycharm2.0,如题,键盘没任何问题,就...