python爬虫--爬取9某1看剧网电视剧
文章目录
- python爬虫--爬取91看剧网电视剧
- 爬取视频必备知识
- 思路
- 代码
- 合并视频
python爬虫–爬取91看剧网电视剧
爬取视频必备知识
https://www.91kanju.com/vod-play/54812-1-2.html
思路
查看网页源代码;发现m3u8的URL
找到ts文件存在的位置:
代码
import requests
import re
#
# obj = re.compile(r"url: '(?P<url>.*?)',",re.S)
# url = 'https://www.91kanju.com/vod-play/54812-1-2.html'
#
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.105 Safari/537.36'}
#
# resp = requests.get(url=url,headers=headers).text
#
# m3u8_url = obj.search(resp).group("url")
#
# print(m3u8_url)
#
# #下载m3u8文件
#
# resp2 = requests.get(url=m3u8_url,headers=headers)
# with open("哲仁王后.m3u8",mode='wb') as fp:
# fp.write(resp2.content)
#本地缓存到m3u8文件后将上面注释掉
n = 1
with open("哲仁王后.m3u8",mode='r',encoding='utf-8') as fp:for line in fp:line = line.strip()if line.startswith("#"):continueif n<10:temp = '0' + '0' + str(n)elif 10<=n<100:temp = '0' + str(n)resp3 = requests.get(url=line,headers=headers)f = open(f"video/{temp}.ts",mode='wb')f.write(resp3.content)f.close()resp3.close()n+=1print(temp)
合并视频
可以使用第三方软件。片段少的话可以使用window自带的合并功能。
打开CMD
例子:
copy/b D:\video\*.ts D:\new.mp4
python爬虫--爬取9某1看剧网电视剧相关推荐
- python爬虫爬取网页新闻标题-看完保证你会
python爬虫爬取网页新闻标题方法 1.首先使用浏览自带的工具--检查,查找网页新闻标题对应的元素位置,这里查到的新闻标题是在 h3 标签中 2.然后使用编辑器编写python代码 2.1方法一: ...
- Python爬虫-爬取快看漫画网图片并拼接成漫画长图
Python爬虫-爬取快看漫画网图片并拼接成漫画长图 1.爬取图片 2.拼接图片 1.爬取图片 import os import requests from bs4 import BeautifulS ...
- python爬虫数据分析可以做什么-python爬虫爬取的数据可以做什么
在Python中连接到多播服务器问题,怎么解决你把redirect关闭就可以了.在send时,加上参数allow_redirects=False 通常每个浏览器都会设置redirect的次数.如果re ...
- python网易云_用python爬虫爬取网易云音乐
标签: 使用python爬虫爬取网易云音乐 需要使用的模块 只需要requests模块和os模块即可 开始工作 先去网易云音乐网页版找一下你想要听的歌曲点击进去.按键盘F12打开网页调试工具,点击Ne ...
- python如何爬取网站所有目录_用python爬虫爬取网站的章节目录及其网址
认识爬虫 网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本.另外一些不常使用的名字还有蚂蚁.自动索引.模拟 ...
- 简单python爬虫爬取游戏wiki立绘
简单python爬虫爬取游戏wiki立绘 玩二次元手游是感叹美少女立绘真好看啊,可惜就是抽不到,于是看到b站wiki上有角色立绘,就写了个爬虫准备将立绘趴下来欣赏(舔). 本人爬虫的技术只算是初学,代 ...
- Python爬虫---爬取腾讯动漫全站漫画
Python爬虫---爬取腾讯动漫全站漫画 操作环境 网页分析 明确目标 提取漫画地址 提取漫画章节地址 提取漫画图片 编写代码 导入需要的模块 获取漫画地址 提取漫画的内容页 提取章节名 获取漫画源 ...
- Python爬虫 爬取豆瓣电影TOP250
Python爬虫 爬取豆瓣电影TOP250 最近在b站上学习了一下python的爬虫,实践爬取豆瓣的电影top250,现在对这两天的学习进行一下总结 主要分为三步: 爬取豆瓣top250的网页,并通过 ...
- python爬虫----爬取网易云音乐
使用python爬虫爬取网易云音乐 目录 使用python爬虫爬取网易云音乐 需要使用的模块 开始工作 运行结果 需要使用的模块 只需要requests模块和os模块即可 开始工作 先去网易云音乐网页 ...
最新文章
- 深入了解Oracle前滚恢复rolling forward(一)
- amd cpu 不兼容centos5.5_AMD放弃兼容性?这事简单也不简单
- 重写(override / overwrite)
- 与JBoss Fuse,Jenkins和Nexus的持续集成
- 黑客攻防技术宝典web实战篇:攻击应用程序逻辑习题
- 【GWT系列】实现远程过程调用
- kafka实现组内广播
- win11开始菜单如何分组 Windows11开始菜单进行分组的设置方法
- 《过程控制系统》习题整理
- cad完全卸载教程_如何完全卸载(删除)cad-百度经验
- 41.朴素贝叶斯Naive Bayes公式推导与理解+求解公园凉鞋问题(借助文氏图)
- net_speeder发双倍包加速
- ROS学习记录16【SLAM】仿真学习5——将cmd_vel转换为ackman小车的速度
- IC Nansha|AMD高级副总裁、大中华区总裁潘晓明:制程、架构、平台优化突破计算边界
- 什么是法?什么是僧?
- 鸿蒙系统为万物互联而生,鸿蒙系统发布:万物互联 EMUI10同台上场
- 如何验证JDK已安装好,环境变量已配置成功
- 破解xp局域网共享限制(XP自由设置共享用户数方法)
- 基于springboot的高校社团管理系统
- 向左转移测试需要团队的努力
热门文章
- python参考文献及其出版社_参考文献查重-Python
- Idea的快捷功能使用统计
- 【mac m1 paddleOCR】安装环境及其坑位
- python猜大小游戏,Python实现的摇骰子猜大小功能小游戏示例
- [OpenCV] CV_32F与CV_8U之间的数据类型转换
- RHCE(四)SAMBA协议
- 3D点集之间计算转移矩阵,旋转R,转移T,新增缩放s (总结全面)
- 计算机二级msoffice选择题知识,2017计算机二级MSoffice选择题练习(含答案)
- 完美解决64位操作系统配置 php无法加载mysql模块问题
- python中的美元符号_类似美元$这个符号pyCharm2.0里怎么输入不好用呢,美元pycharm2.0,如题,键盘没任何问题,就...