python微博视频爬取
微博视频爬取
在前文爬取图片的基础上,修改其中的json筛选条件就可以
前文
https://blog.csdn.net/weixin_43596589/article/details/122215981
还是因为线程下载会个别出错,所以我选择生成的链接使用迅雷
get_pics_url函数如下
def get_pics_url(self):i = 1url_list=[]while True:url = self.start_url + '&page={}'.format(i)headers = {'User-Agent': get_ua()}r = requests.get(url, headers=headers)_json = json.loads(r.text)items = _json["data"]["cards"]flag = _json['ok']if flag == 1: # 爬取数据标志+一个手动控制标志for v in items:picslist = v.get('mblog')if picslist is not None:pageInfoList = picslist.get('page_info')if pageInfoList is not None:urlsList = pageInfoList.get('urls')if urlsList is not None:img_url = urlsList.get('mp4_720p_mp4')if img_url is not None:url_list.append(img_url)else:img_url = urlsList.get('mp4_hd_mp4')if img_url is None:print(urlsList)url_list.append(img_url)else:#1.06页数显示出现问题t1.insert(END, f'***在第{i}页终止***\n')t1.see(END)t1.update()if r1_var.get() == 1:big_dir=disk+':/WeiBo_Pics'os.startfile(big_dir)breaki += 1print("url共有个数")print(len(url_list))# return url_list#网上找的将整个list写入txtfile = open(user_name_selected+'mp4.txt', 'w')for i in range(len(url_list)):s = str(url_list[i]).replace('{', '').replace('}', '').replace("'", '').replace(':', ',') + '\n'file.write(s)file.close()return ""
python微博视频爬取相关推荐
- Python 实现视频爬取下载及断点续传优化、异步下载
转载自公众号:FightingCoder 一般情况下我们使用爬虫更多的应该是爬数据或者图片吧,今天在这里和大家分享一下关于使用爬虫技术来进行视频下载的方法,不仅可以方便的下载一些体积小的视频,针对大容 ...
- python写图片爬取软件_python制作微博图片爬取工具
有小半个月没有发博客了,因为一直在研究python的GUI,买了一本书学习了一些基础,用我所学做了我的第一款GUI--微博图片爬取工具.本软件源代码已经放在了博客中,另外软件已经打包好上传到网盘中以供 ...
- python爬取b站视频封面_学习笔记(4)[Python爬虫]:爬取B站搜索界面的所有视频的封面...
学习笔记(4)[Python爬虫]:爬取B站搜索界面的所有视频的封面 import os import requests import re import json from bs4 import B ...
- Python爬虫系列之抖音热门视频爬取
Python爬虫系列之抖音热门视频爬取 主要使用requests库以及手机抓包工具去分析接口 该demo仅供参考,已经失效,需要抖音2019年5月最新所有接口请点击这里获取 抖音资源获取接口文档请点击 ...
- python爬虫实战-爬取视频网站下载视频至本地(selenium)
#python爬虫实战-爬取视频网站下载视频至本地(selenium) import requests from lxml import etree import json from selenium ...
- python可以爬取的内容有什么_Python爬取视频(其实是一篇福利)过程解析 Python爬虫可以爬取什么...
如何用python爬取视频网站的数据 如何用python爬取js渲染加载的视频文件不是每个人都有资格说喜欢,也不是每个人都能选择伴你一生! 有哪位大神指导下,有些视频网站上的视频文件是通过 js 加载 ...
- Python Fiddler 钉钉PC端群回放视频爬取
Python Fiddler 钉钉PC端群回放视频爬取 钉钉群里的回放视频被群管理员设置为不能下载,可是有时候又需要这些视频可以方便传阅和打开调倍速等等,而且还可以不用再打开PC端就可以直接看到视频多 ...
- Python爬虫,爬取百度贴吧图片和视频文件,xpath+lxml,访问被拒的原因分析
目录 百度贴吧图片和视频文件爬取程序 1.需求分析 2.url分析 3.Xpath分析 4.程序设计 5.坑点 百度贴吧图片和视频文件爬取程序 1.需求分析 进入百度贴吧,搜索周杰伦,进入周杰伦吧.我 ...
- Python 视频爬取与存储
可以把视频存到本地,前提是有视频链接,有的还要登录,我还不会/(ㄒoㄒ)/~~. 这里爬取的是MOOC上的视频,也是我学习的地方. 将链接保存在.py文件同目录下的.txt里即可 import req ...
- python B站原视频爬取,最高清晰度爬取。将你喜欢的up主的视频保存下来吧。
B站原视频爬取,我就不多说直接上代码.直接运行就好. B站是把视频和音频分开.要把2个合并起来使用.这个需要分析才能看出来.然后就是登陆这块是比较难的. import os import re imp ...
最新文章
- linux shell 宏定义_Linux系统和Shell命令行简介,走上数据分析之路
- Linux 网络编程—— libpcap 详解
- 【263】Linux 添加环境变量 全局 shell 脚本
- i++ 和 ++i 效率的分析以及自定义类型的自增/自减运算符重载实例
- OCP-052考试题库汇总(58)-CUUG内部解答版
- 计算机会计和传统手工会计的区别,手工会计与计算机会计之间的区别.doc
- 别再这么写代码了,这几个方法不香吗?
- F5 APM针对Vmware view7.3 VDI业务发布测试问题分析
- 加密芯片提升消费电子产品设备的安全性能
- python使用-Pyhton 单行、多行注释符号使用方法及规范
- 【转】iOS多线程编程技术之NSThread、Cocoa NSOperation、GCD
- m3000服务器维修,陕汽德龙新M3000,仪表上有个故障灯,红颜色⭕里有个❌是个什么故障灯了...
- java识别答题卡纸_opencv 识别答题卡
- 浅析ERP系统--质量
- 安卓手机远程控制安卓手机
- 菜鸟Axios学习=官网
- 4000字干货长文!从校招和社招的角度说说如何准备大厂面试?
- GitLab使用CAS服务进行单点登录配置
- Qt QSqlQueryModel实现查询数据库内容
- webview加载网页,tel协议不会调出拨号盘?该如何处理
热门文章
- 如何写一份合格的SAP功能开发说明书--报表类
- 基于 Layui form 组件的省市区级联的实现 - 组件化
- 如何搭建自己的网站别人可以直接访问
- window.onload=function()是什么意思
- 坦克大战java主要设计思想_坦克大战游戏Java网络版设计开题报告
- API文档打开显示'已取消到该网页的导航'的解决方法
- 5.MySQL高级语句,你给我学!
- 玩聚榜单-仿照Technorati的Popular频道
- 读书项目:ePub标准介绍
- 总结谷歌身份验证器 Google Authenticator 的详细使用方法