本文讲述爬取抖音APP视频数据(本文未完,后面还有很多地方优化总结)

公众号回复:抖音

即可获取源码

1、APP抓包教程,需要用到fiddler

fiddler配置和使用查看>>王者荣耀盒子APP抓包配置方法

2、寻找返回用户aweme_count和uid数据的接口

进入我关注的抖音用户主页,找到用户的抖音号并记录下来,该抖音号为unique_id(unique_id区别于uid)

用户主页有如下数据:如图所示

注:该页面并没有返回我们需要的uid数据,需要通过如下方式搜索,在另外一个页面抓包才能获取

抖音主页点击搜索图标

输入用户主页获取到的unique_id值,并点击搜索

进入该页面,切换到用户栏,该页面会返回我们需要的数据和接口

fiddler抓包,该接口返回我们需要的两个参数,作品数aweme_count和用户uid

上代码,input输入的为用户主页的unique_id,传入下面的方法中

拿到unique_id,我们请求接口,提取我们需要的数据aweme_count和uid,并打印成功,这一步结束

注:本网站为HTTPS加密,需要加verify=False参数,并要加headers

3、接下来寻找视频播放页面接口

手机切换到用户主页,会出现我们需要抓包的接口,因为用户主页有视频,自然接口在这里面

抓包,成功抓到下面图中所示的share_url接口,该接口需要我们传2个参数,就是上一步我们获取到的aweme_count和uid

注:share_url并不是最终我们真正下载视频的接口,需要对share_url返回的数据进一步提取,才能找到真正的视频接口

上代码,但该接口测试一些发现有些不方便用,经查阅网上一些资料,发现需要用到抖音之前的老接口,如代码中所示

这里获取得到的video_urls是一个假的视频接口,需要进一步提取真的视频接口

将video_urls传进下载视频的方法中,中间我调用了get_download_url方法,进一步提取真正的视频接口

提取真正视频接口,通过get请求假接口,在返回的一大坨响应中通过正则匹配提取

这里简单截图了两个视频接口的区别,这幅图是假的视频接口,虽然也有视频,但并不是真正的

下面这个才是我们真正的视频接口,整个页面只有一个视频,直接下载视频数据

至此,抖音爬取告一段落,还遗留两个问题,尚未完全搞出来

1、如何获取所有用户的抖音unique_id,而不必手动每次去查看后输入

2、如何去水印

这两个问题也已经尝试,没有那么容易,有兴趣的同学欢迎测试,有思路欢迎探讨

欢迎添加好友学习探讨,备注(CSDN)

---------------------

作者:python爬虫人工智能大数据

python爬app视频_python爬取抖音APP视频教程相关推荐

  1. python爬取抖音APP视频教程

    本文讲述爬取抖音APP视频数据(本文未完,后面还有很多地方优化总结) 公众号回复:抖音 即可获取源码 1.APP抓包教程,需要用到fiddler fiddler配置和使用查看>>王者荣耀盒 ...

  2. python命令行视频转字符(抖音同款)

    最简单python命令行视频转字符(抖音同款) 可自由选择对比度(ascii_char 代表用到的字符,从像素多到少,字符数越多对比度越低) 使用方法: 1. 将代码中'video_3.mp4'替换成 ...

  3. Python爬取抖音app视频

    作者:哈库呐玛塔塔 来源:https://urlify.cn/ANzAre 记录一下如何用python爬取app数据,本文以爬取抖音视频app为例. 编程工具:pycharm app抓包工具:mitm ...

  4. 青灯教育python免费公开课_如何使用Python爬取抖音APP视频

    记录一下如何用python爬取app数据,本文以爬取抖音视频app为例. 编程工具:pycharm app抓包工具:mitmproxy app自动化工具:appium 运行环境:windows10 假 ...

  5. 使用python爬取抖音app视频(appium可以操控手机)

    记录一下如何用python爬取app数据,本文以爬取抖音视频app为例. 编程工具:pycharm app抓包工具:mitmproxy app自动化工具:appium 运行环境:windows10 思 ...

  6. Python爬取 抖音 App短视频信息

    1. Charles获取视频接口  爬取之前先将手机与PC至于同局域网并确保手机WIFI的代理端口为8888,然后打开Charles获取视频请求的链接,如图: 2. 手动上滑触发视频请求接口   自动 ...

  7. 教你用python爬取抖音app视频

    记录一下如何用python爬取app数据,本文以爬取抖音视频app为例. 编程工具:pycharm app抓包工具:mitmproxy app自动化工具:appium 运行环境:windows10 思 ...

  8. 使用python爬取抖音app视频

    记录一下如何用python爬取app数据,本文以爬取抖音视频app为例. 编程工具:pycharm app抓包工具:mitmproxy app自动化工具:appium 运行环境:windows10 思 ...

  9. 使用python爬取抖音app视频!谁说APP数据爬不了的!

    记录一下如何用python爬取app数据,本文以爬取抖音视频app为例. 编程工具:pycharm app抓包工具:mitmproxy app自动化工具:appium 运行环境:windows10 思 ...

最新文章

  1. 注意!Apache下这些与Hadoop相关的开源项目要退休了!
  2. 连续 3 年最受欢迎:Rust,香!
  3. 2016.3.22(关系型数据库简介,管理数据库和表)
  4. enmo_day_06
  5. Python编程从入门到实践~函数
  6. STM32那点事(5)_ADC(中)
  7. 计算机辅助园林设计常用软件,计算机辅助园林设计应用探讨.doc
  8. 人工智能翻译之间的对决:谷歌为什么败给了有道?
  9. 计网笔记(一) 什么是因特网
  10. python 绘制多个子图
  11. redis技术分享ppt_技术分享丨华为鲲鹏架构Redis知识二三事
  12. css3 水纹效果(仿写阿里云)
  13. 第十届中国证券金紫荆奖名单揭晓 华能国际斩获两项大奖
  14. android 字符串 声波,识别成功率100%的声波配网,看完你也可以实现一个
  15. qt+opencv实现敏感区域移动侦测
  16. NLP NLU NLG 简介
  17. 如何在计算机面试中牵着面试官鼻子走?
  18. 国外大学老师用Prof.还是Dr.称呼?
  19. H5无插件实现实时海康、大华摄像头网页预览
  20. QT_disconnect

热门文章

  1. springmvc的一些优化设置
  2. 人生需要积极勇敢的去面对
  3. 运算符和结合性(转)
  4. MySQL 数据库导出
  5. 博客开园了~~~~~~
  6. oracle修改用户密码
  7. Delphi 2009 的反射单元(ObjAuto):
  8. 【Linux】复制文件到当前目录 / 复制文件并重命名到当前目录
  9. Ubuntu18.04安装Gstreamer1.0(六)
  10. Android Sensor架构和原理分析