python抓取视频真实地址_快手批量获取真实地址python
import requests
from bs4 import BeautifulSoup
import re
import xlrd
import xlwt
class KSNoMark():
# 忽略警告代码
requests.packages.urllib3.disable_warnings()
def GetShareUrl(self):
try:
# 打开Excel表格
wb = xlrd.open_workbook('分享链接.xlsx')
# 获取当前正在显示的sheet
sheet = wb.sheet_by_name('url')
urls = [(sheet.cell_value(i, 0))for i in range(1, sheet.nrows)]
while '' in urls:
urls.remove('')
except FileNotFoundError:
print("分享链接.xlsx文件不存在")
return urls
def GetRealUrl(self):
headers = {
'User-Agent': 'Mozilla/5.0 (iPhone; CPU iPhone OS 13_2_3 like Mac OS X) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/13.0.3 Mobile/15E148 Safari/604.1',
'Cookie': 'did=web_e4581e2dbe33aae5eac3d9fdf8b12566;',
}
urls = self.GetShareUrl()
# 创建一个workbook设置编码
workbook = xlwt.Workbook(encoding='utf-8')
# 创建一个worksheet
worksheet = workbook.add_sheet('realLinks')
row_num = 0
for url in urls:
worksheet.write(row_num, 0, url)
response = requests.get(url, headers=headers, allow_redirects=False,verify=False)
share_url = response.headers['Location']
share_response = requests.get(share_url,headers=headers,verify=False).text
# 通过BeautifulSoup提取无水印播放地址字符串
soup = BeautifulSoup(share_response,'lxml')
noWaterMarkVideo = soup.find(attrs={'id': 'hide-pagedata'}).attrs['data-pagedata']
try:
# 正则处理字符串获取真实地址
pattern = re.compile('\"srcNoMark\":"(.*?)"},',re.S)
real_url = re.findall(pattern,noWaterMarkVideo)[0]
worksheet.write(row_num, 1, real_url)
except Exception as e:
print(e)
pass
row_num += 1
# 保存
workbook.save('快手视频真实地址.xls')
continue
if __name__ == '__main__':
KSNoMark = KSNoMark()
KSNoMark.GetRealUrl()
print("快手真实地址采集完成")
表格名称:分享链接.xlsx
sheet名称:url
第一列第一行:分享链接
第一列 第2-n行:需要解析的分享视频地址
python抓取视频真实地址_快手批量获取真实地址python相关推荐
- python抓取抖音评论_一篇文章教会你用Python抓取抖音app热点数据
今天给大家分享一篇简单的安卓app数据分析及抓取方法.以抖音为例,我们想要抓取抖音的热点榜数据. 要知道,这个数据是没有网页版的,只能从手机端下手. 首先我们要安装charles抓包APP数据,它是一 ...
- Python抓取视频内容
Python抓取视频内容 Python 是一种面向对象.解释型计算机程序设计语言,由Guido van Rossum于1989年底发明,第一个公开发行版发行于1991年.Python语法简洁而清晰,具 ...
- python 抓取解析接口数据_[干货]用python抓取摩拜单车API数据并做可视化分析(源码)...
原标题:[干货]用python抓取摩拜单车API数据并做可视化分析(源码) 在APP中能看到很多单车,但走到那里的时候,才发现车并不在那里.有些车不知道藏到了哪里:有些车或许是在高楼的后面,由于有GP ...
- python抓取视频违法吗,科学网—【python爬虫】抓取B站视频相关信息(一) - 管金昱的博文...
昨天我在B站上写了这么一篇文章,但是被他们锁住了.无奈之下我复制到知乎上先保存起来 在这篇名为<三天学会用python进行简单地爬取B站网页视频数据>文章中我主要提到了两点在已知aid的情 ...
- python抓取pc端数据_「爬虫四步走」手把手教你使用Python抓取并存储网页数据!...
爬虫是Python的一个重要的应用,使用Python爬虫我们可以轻松的从互联网中抓取我们想要的数据,本文将基于爬取B站视频热搜榜单数据并存储为例,详细介绍Python爬虫的基本流程.如果你还在入门爬虫 ...
- python抓取数据时失败_爬取数据缺失的补坑,Python数据爬取的坑坑洼洼如何铲平...
渣渣业余选手讲解,关于爬取数据缺失的补坑,一点点关于Python数据爬取的坑坑洼洼如何铲平,个人的一些心得体会,还有结合实例的数据缺失的补全,几点参考,仅供观赏,如有雷同,那肯定是我抄袭的! 在使用P ...
- python抓取视频中的人物动作,并生成3D的bvh
视频中的人物抓取 查看视频时,看到很多人的动作特别潇洒.就想做动作抓取 参考了别人的案例,自己进行布局 特别感谢 作者:StubbornHuang <我的开源项目 – 3DPoseEstimat ...
- python抓取股票竞价数据_【整理】用Python+beautifulsoup抓取股票数据
[刚开始写总结,读者如果对我的内容有任何建议欢迎留言反馈,或直接加QQ1172617666,期待交流] 先贴上代码,再详细的写一下在写这些代码的过程中遇到的问题,解决的方法. 这些代码完成的任务是:访 ...
- python抓取京东联盟优惠券_[爬虫]使用python抓取京东全站数据(商品,店铺,分类,评论)...
网上抓取京东数据的文章,现在要么无法抓取数据,要么只能抓取部分数据,本文将介绍如何抓取京东全站数据,包括商品信息.店铺信息,评论信息,分类信息等. -------------------------- ...
最新文章
- 报名开启!AI+科学计算专场直播:大咖齐聚×独家礼物,限量200份
- linux如何执行平台,如何在Linux平台运行HelloWorld及测试项目
- window apktool 的下载
- [html] 说说你对html中的置换元素和非置换元素的理解
- Google 资深软件工程师 LeetCode 刷题笔记首次公开
- python中的return和print的区别_python中return和print的区别(详细)
- ICCV 2019 | 旷视研究院提出文字检测新方法:像素聚合网络PAN
- 程序员奉劝年轻人转行趁早:工作8年存款百万,33岁找不到工作
- Netty的并发编程实践1:正确使用锁
- python求最大值最小值求和_python3.2求和与最值
- QQ输入法 for iPhone2.3
- 史上最管用的C盘深度清理秘籍
- 面试被问到HashMap 底层原理?看完这边文章绝对不慌!
- 完全激活win server 2012 R2 的方法(亲测可行!)
- php codeigniter 教程,CodeIgniter操作教程
- Linux中vsftpd服务配置(匿名,用户,虚拟用户)
- python数据导入与清洗_Python学习之 数据清洗之增删改查
- java8新特性总结——lambda表达式
- EXCEL词典(xllex.dll)文件丢失或损坏的解决方法
- 何为Agile,何为Scrum
热门文章
- Win10安装YOLOv3.0
- 区块链三加一:资产不可复制性
- 阿莫电子为啥越来越差?
- 学会感谢--谈辞职信的写法
- SpringWeb项目Maven执行clean命令后编译拒绝访问的解决方法
- FPGA配合debussy、modelsim仿真环境搭建
- 用音响里的零件做迷你小机器人_优必选和腾讯一起做了款人形机器人,搭载“小微”的它想比智能音箱更好用...
- 计算机任务驱动法教学应用,_任务驱动法_在计算机基础教学中的应用
- 越美丽的东西我越不可碰 | 天蝎座如何在黑暗中找到那束光
- Mybatis【面试题】