这篇文章我们来讲一下在网站建设中,Python爬虫之App爬虫视频下载的实现。本文对大家进行网站开发设计工作或者学习都有一定帮助,下面让我们进入正文。

前言

随着手app的发展逐渐强大,我们手机应用每天的生活也是非常的多。那我们怎么知道他的数据是怎么形成的,通过电脑端如何爬取。相信大家也有这样的问题。下面我将讲解这些操作流程。

一、操作流程

首先我们要有

fidder4

夜神模拟器

pycharm

python3.0或以上版本

二、fidder4抓包

1.fidder配置

首先我们先下载fidder,

打开Fiddler,点击Tools => Options 打开配置选项,切换到第二个标签页HTTPS,先在这里打勾

然后就是点下面如图所示的单选框,点击Actions,运行第一个Trust Root Certificate。后面会有一个框,记得点击确定。

打开Fiddler,点击Tools => Options… 打开配置选项,切换到第三个标签页Connections,修改如图所示的地方,端口号可任意修改,这里使用我自定的9999,请记住自己设置的端口号,后面有需要使用的地方。

2.模拟器配置

我们为什么使用模拟器,因为由于Fidder抓包,要在局域网环境下,我们大部分电脑都是以宽带连接,所以我这里就以模拟器讲解抓包,后续我会更新一期fidder手机抓包。

这里们先打模拟器,设置模拟器的代理。我们先查看自己的本机IP,通过cmd命令输入ipconfig即可查看本机的ip,我的本机IP是192.168.1.2

这里打开模拟器的设置,找到我们WLAN用点击,我们看到我们的wifi,用鼠标点击时间长一点,它会出现设置的,下面我用视频给大家看一下

我们本机ip进行代理哦

3.模拟器证书安装

我们用模拟器打开浏览器,输入我们本机ip加端口,就是 192.168.1.2:9999

点击这个下载证书,下载完成后安装证书,命名随便命名。密码自己要记入。

上述如果都做成功了,应该就没什么问题了。

三、fidder4解析视频网站

这是我们模拟器里的app,app名字我会在下面评论发出。

这里的所和上面的正好相对应,这里相信我们大家都找到了,

我们可以把fidder抓包到的数据在这里,这个是我们的数据网址

https://v.6.cn/coop/mobile/index.php?act=recommend&padapi=minivideo-getlist.php&page=1

我们通过模拟器视频往下滑,可以知道它是分页的,那样会有好多小姐姐视频哦,

https://v.6.cn/coop/mobile/index.php?act=recommend&padapi=minivideo-getlist.php&page=2

这里就是第二页的数据,这个时候就可以通过pycharm进行解析了。

pycharm编写app代码

import requests

import json

def Demo(page):

url='https://v.6.cn/coop/mobile/index.php?act=recommend&padapi=minivideo-getlist.php&page={}'.format(page)

header={

'User-Agent':'XY0xDgIxDAS)wgtOthPHTn5AQUVFdXLOCRwSdEhX5PGQFmlHo6n22D)bw973lz13W2)XlZe8pKEpEEdBTgmU4ricT3kQENEI04ATJcbg2VsnEcvoVttmTXpq7r)sVToAdNLqmaxF1B6HFigkhXgO(f)rCw@@'

}

response = requests.get(url,headers=header,verify=False).json()

data=response['content']['list']#由于网站是json数据我们可以通过json解析,然后在进行数据的爬取

for i in data:

title =i['title'] #这里爬取的是视频标题

playurl=i['playurl']#这里是爬取是的视频的url

Video(title,playurl)

def Video(title,playurl):

header = {

'User-Agent': 'XY0xDgIxDAS)wgtOthPHTn5AQUVFdXLOCRwSdEhX5PGQFmlHo6n22D)bw973lz13W2)XlZe8pKEpEEdBTgmU4ricT3kQENEI04ATJcbg2VsnEcvoVttmTXpq7r)sVToAdNLqmaxF1B6HFigkhXgO(f)rCw@@'

}

response = requests.get(playurl,headers=header,verify=False)

# 文件写入异常机制

try:

#由于写入可以会有点出错,我们要加一个异常处理机制,这样可以提高我们的程序性能。

with open('VIdeo/{}.mp4'.format(title),'ab') as f:

f.write(response.content)

except Exception as e:

print(e)

for i in range(1,11):

Demo(i)

总结

以上就是今天要讲的内容,本文简单的对fidder配置与模拟器的证书安装,通过fidder监视app传输的数据进行解析,我们知道此网址有分页功能 ,最后我们通过pycharm编写程序,这些操作看似繁锁,其实看懂了,就很简单。

到此这篇关于Python爬虫之App爬虫视频下载的实现的文章就介绍到这了,更多相关Python App爬虫视频下载内容请搜索本站以前的文章或继续浏览下面的相关文章感谢支持!

相关阅读

python爬虫app步骤_Python爬虫之App爬虫视频下载的实现相关推荐

  1. python安装默认路径_Python pip install如何修改默认下载路径

    Python pip install如何修改默认下载路径 pip动不动就下载数百M的文件.这些文件默认在C:盘,那么为了节省空间需要修改这些路径: 打开cmd命令窗口.输入: python -m si ...

  2. 爬虫+pyqt5 打造属于自己的抖音视频下载器

    前言:最近一段时间在家经常会用抖音来度过娱乐时间,经常会直接通过抖音软件向好友分享视频.自己无聊至极就花了一上午的时间做了一个PC端的抖音视频下载器. 郑重申明:该文章介绍的技术仅供用于学习,不可恶意 ...

  3. 【Python工具】Python实现一款支持各大平台的视频下载器 | 附源码

    相关文件 想学Python的小伙伴可以关注小编的公众号[Python日志] 有很多的资源可以白嫖的哈,不定时会更新一下Python的小知识的哈!! 需要源码的小伙伴可以在公众号回复视频下载器 简介 一 ...

  4. python爬虫app步骤_Python爬虫抓取手机APP的传输数据,python爬虫抓取app

    Python爬虫抓取手机APP的传输数据,python爬虫抓取app 大多数APP里面返回的是json格式数据,或者一堆加密过的数据 .这里以超级课程表APP为例,抓取超级课程表里用户发的话题. 1. ...

  5. python如何设计爬虫界面软件_Python+PyQt5设计B站视频数据爬虫小程序

    本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. 以下文章来源于菜J学Python ,作者J哥 前言 目前,市场上有大量 Python图形用户界面( ...

  6. python怎么爬虫理数据_Python神技能 | 使用爬虫获取汽车之家全车型数据

    最近想在工作相关的项目上做技术改进,需要全而准的车型数据,寻寻觅觅而不得,所以就只能自己动手丰衣足食,到网上获(窃)得(取)数据了. 汽车之家是大家公认的数据做的比较好的汽车网站,所以就用它吧.(感谢 ...

  7. python反爬虫与绕过_python中绕过反爬虫的方法总结

    我们在登山的途中,有不同的路线可以到达终点.因为选择的路线不同,上山的难度也有区别.就像最近几天教大家获取数据的时候,断断续续的讲过header.地址ip等一些的方法.具体的爬取方法相信大家已经掌握住 ...

  8. python写采集程序_python实现简易采集爬虫

    #!/usr/bin/python#-*-coding:utf-8-*- #简易采集爬虫#1.采集Yahoo!Answers,parseData函数修改一下,可以采集任何网站#2.需要sqlite3或 ...

  9. python能写app吗_Python可以开发APP吗?

    在很多人的印象中,Python是一门无所不能的编程语言,它可以应用在各大领域,并具有优异的表现,那么Python可以开发APP吗?近期不少人都很关心这个问题,接下来由小编为大家简单介绍一下. 答案是可 ...

最新文章

  1. java static method_java static关键字静态方法详解,静态方法实例分享
  2. Web前端之登录表单
  3. 初学__Python——用包来管理多个模块
  4. Oracle+BEA后的ESB
  5. 使用网络进行项目托管
  6. wordpress标签或者固定地址中文404错误解决插件
  7. Mob云验证,让身份验证更简单
  8. 计算机半小时后关机代码,电脑自动关机代码
  9. AI配音专家(文字转语音真人发声工具)官方中文版V1.0.5 | 文字转语音软件下载 | 这是一款阿里语音合成引擎且能把文字读出来的软件
  10. java -jar 命令隐藏黑窗口
  11. java与VUE有啥不同_React的世界观及与Vue之比较
  12. cad 三点绘制斜矩形
  13. 重载和重写(覆盖)的区别
  14. Python 百度智能云文字识别 实现手写文字识别
  15. oracle增加dbf文件,oracle导入dbf文件工具下载|
  16. 电脑启动计算机无法启动 修复工具栏,如何利用Win7启动修复功能解决电脑启动进不了系统的问题...
  17. ANSI标准数据类型
  18. Xtend调用Scilab
  19. strom及DRPC性能测试与改进
  20. java map 参数传递_Java参数传递分析

热门文章

  1. 高级前端必会手写面试题及答案
  2. Networkx如何画点图并显示边权
  3. 荣耀v40pro和华为nova8pro哪个好?
  4. norton disk doctor
  5. 小米随身wif linux平台配置
  6. 淘宝直播怎么做,主播怎么做才能引流,卖出产品
  7. 测试用例-------纸杯
  8. c语言仿ce内存搜索工 源代码_CE的AOB_scan功能源码内存搜索特征码
  9. 中国教育“善意的谎言”与恶果
  10. python抓包检测入侵_如果你喜欢python爬虫,不妨看看这篇验证码的抓包技巧与识别!...