Python爬虫系列之抖音热门视频爬取

主要使用requests库以及手机抓包工具去分析接口

该demo仅供参考,已经失效,需要抖音2019年5月最新所有接口请点击这里获取

抖音资源获取接口文档请点击这里

代码仅供学习交流,请勿用于非法用途

小程序爬虫接单、app爬虫接单、网页爬虫接单、接口定制、网站开发、小程序开发 > 点击这里联系我们 <

微信请扫描下方二维码

详细实战过程此处不列出了,后期有时间会出一个详细的教程

import requests
import json
import urllib.parse
import time'''@Author     :王磊@Date       :2018/12/5@Description:爬取抖音热门视频
'''headers = {"Cookie": "install_id=53112482656; ttreq=1$a4ed279b42b9acb3dee9a3a3c2d645ce99ed786f; odin_tt=38d535495242f853ffdf693ae531a152910b1047bbb3ba5c8e2fa7f3cbd7f6a1ec9f6027fc44ea36c4bd45281487d4a7; sid_guard=d074b1c430eef87a3599e20ef34a5555%7C1543976393%7C5184000%7CSun%2C+03-Feb-2019+02%3A19%3A53+GMT; uid_tt=4e0b25bc326fae6b428afc5826243eeb; sid_tt=d074b1c430eef87a3599e20ef34a5555; sessionid=d074b1c430eef87a3599e20ef34a5555","Accept-Encoding": "gzip","X-SS-REQ-TICKET": "1543976807598","X-Tt-Token": "00d074b1c430eef87a3599e20ef34a5555b97ecb95bff1a3d1a81726386a1adf7a91df6c32bfa121fc10400ffede8df72016","sdk-version": "1","X-SS-TC": "0","User-Agent": "com.ss.android.ugc.aweme/350 (Linux; U; Android 8.0.0; zh_CN; MI 5; Build/OPR1.170623.032; Cronet/58.0.2991.0)"
}def getHTML(url):'''get方式获取html:param url::return:'''rsp = requests.get(url, headers=headers)return rsp.content.decode(rsp.apparent_encoding, 'ignore')def postHTML(url):'''post方式获取html:param url::return:'''rsp = requests.post(url,headers=headers)return rsp.content.decode(rsp.apparent_encoding, 'ignore')def getVideo(key):'''获取第一个视频连接地址:param key::return:'''# 编译关键词key = urllib.parse.quote(key)# 拼接关键词搜索接口urlurl = 'https://api.amemv.com/aweme/v1/general/search/single/?keyword=' + key + '&offset=0&count=10&is_pull_refresh=0&hot_search=0&latitude=30.725991&longitude=103.968091&ts=1543984658&js_sdk_version=1.2.2&app_type=normal&manifest_version_code=350&_rticket=1543984657736&ac=wifi&device_id=60155513971&iid=53112482656&os_version=8.0.0&channel=xiaomi&version_code=350&device_type=MI%205&language=zh&uuid=862258031596696&resolution=1080*1920&openudid=8aa8e21fca47053b&update_version_code=3502&app_name=aweme&version_name=3.5.0&os_api=26&device_brand=Xiaomi&ssmix=a&device_platform=android&dpi=480&aid=1128&as=a1e5055072614ce6a74033&cp=5813c65d2e7d0769e1[eIi&mas=01327dcd31044d72007555ed00c3de0b5dcccc0c2cec866ca6c62c'# 获取搜索界面并转化为json对象jsonObj = json.loads(postHTML(url))# 获取data对应vmetes = jsonObj['data']nums = len(metes)uri = ''# 多个视频列表捕获第一个视频地址即刻返回视频uri(视频唯一标识)for _ in range(nums):data = metes[_]['aweme_info']['video']if 'download_suffix_logo_addr' in data.keys():uri = data['download_suffix_logo_addr']['uri']break# 拼接视频地址videoURL = 'https://aweme.snssdk.com/aweme/v1/playwm/?video_id=' + uri + '&line=0'# 返回视频地址return videoURLdef main():'''入口函数:return:'''ts = str(time.time())# 入口url(热门列表url)url = 'https://aweme.snssdk.com/aweme/v1/hot/search/list/?detail_list=0&ts=' + ts + '&js_sdk_version=1.2.2&app_type=normal&manifest_version_code=350&_rticket=1543976807872&ac=wifi&device_id=60155513971&iid=53112482656&os_version=8.0.0&channel=xiaomi&version_code=350&device_type=MI%205&language=zh&resolution=1080*1920&openudid=8aa8e21fca47053b&update_version_code=3502&app_name=aweme&version_name=3.5.0&os_api=26&device_brand=Xiaomi&ssmix=a&device_platform=android&dpi=480&aid=1128&as=a1c56320b7f6ccc7874900&cp=3d63c15f7576037de1_uMy&mas=01258b5acd59f6bccb58178086286fdded0c0c9c2cec1cecc6c6c6'# 获取热门列表数据html = getHTML(url)# 转化为json对象jsonObj = json.loads(html)# 获取每一个热门数据列表word_list = jsonObj['data']['word_list']index = 1# 循环解析每个热门事件for li in word_list:try:word = li['word']hot_value = li['hot_value']hot_index = indexvideoURL = getVideo(word)index += 1print("排名:%d ,关键词: %s ,热度值: %d ,视频下载地址: %s" % (hot_index, word, hot_value, videoURL))except Exception as e:passfinally:time.sleep(3)if __name__ == '__main__':main()

☞点击这里与我探讨☚

♪♪♪♪♪♪♪♪♪♪♪♪♪♪♪♪♪♪♪♪♪♪♪♪♪♪♪♪♪♪♪♪♪♪♪♪♪♪♪♪♪♪♪♪♪♪♪♪♪♪♪♪♪
♪♪后续会更新系列基于Python的爬虫小例子,欢迎关注。♪♪
♪♪♪♪♪♪♪♪♪♪♪♪♪♪♪♪♪♪♪♪♪♪♪♪♪♪♪♪♪♪♪♪♪♪♪♪♪♪♪♪♪♪♪♪♪♪♪♪♪♪♪♪♪

Python爬虫系列之抖音热门视频爬取相关推荐

  1. 利用python爬虫实现:抖音短视频无水印视频下载

    各位小伙伴,之前一段时间迷上了抖音小姐姐视频,但是下载的视频都有水印,于是自己用Python 写了个爬取小姐姐视频的工具,大家可以直接拷贝到自己编译器上运行.经过半天的琢磨,自己用python搞出来一 ...

  2. Python爬虫实战(十一) B站热门信息爬取(窗口版)| Tkinter实现GUI交互式界面

    目录 一.主页面设计 1.1 Tkinter基本介绍 1.2 设计布局 二.查询功能实现 2.1 分区字典构建 2.2 输入日期处理 2.3 书写爬虫函数 三.全部代码 更多信息查询(2021-2-1 ...

  3. Python爬虫系列之双色球开奖信息爬取

    Python基于Beautiful Soup库对双色球开奖信息进行爬取 代码仅供学习交流,请勿用于非法用途 小程序爬虫接单.app爬虫接单.网页爬虫接单.接口定制.网站开发.小程序开发 > 点击 ...

  4. python爬虫系列(5.3-动态网站的爬取的策略)

    一.认识动态网站 所谓的动态网站,是使用ajax加载出来的网页,我们打开网页的时候可以正常显示内容,但是我们在显示网页源代码的时候,里面却找不到该节点. 二.常见动态网站的抓取方式 1.直接分析aja ...

  5. 对你没有看错!不到 10 行代码完成抖音热门视频的爬取!

    [摘要] 最近研究了一下抖音的爬虫,目前实现了热门话题和热门音乐下面所有相关视频的爬取,并且我已经将该爬虫打包成了一个 Python 库并发布,名称就叫做 douyin,利用该库可以使用不到 10 行 ...

  6. ae手机版特效软件如何制作抖音热门视频飞天特效的教程

    ae手机版特效软件如何制作抖音热门视频飞天特效的教程 ae手机版下载ae手机版特效软件下载ae手机版特效软件教程 抖音热门视频上的飞天特效.腾云驾雾特效等等视频很多人看完感觉惊奇,问手机可以做吗,其实 ...

  7. 抖音短视频实操:抖音热门视频的分类特点,如何选择视频内容并创作(下)

    抖音短视频实操:抖音热门视频的分类特点,如何选择视频内容并创作(下) 前面上篇和中篇给大家聊了聊短视频的种类和怎么选择我们的视频内容,选好内容以后,就涉及到了内容创作,内容创作上我们要如何去分析.找到 ...

  8. Python爬虫:最牛逼的 selenium爬取方式!

    Python爬虫:最牛逼的 selenium爬取方式! 作为一个男人 在最高光的时刻 这是小编准备的python爬虫学习资料,加群:700341555即可免费获取! Python爬虫:最牛逼的 sel ...

  9. Python爬虫:运用多线程、IP代理模块爬取百度图片上小姐姐的图片

    Python爬虫:运用多线程.IP代理模块爬取百度图片上小姐姐的图片 1.爬取输入类型的图片数量(用于给用户提示) 使用过百度图片的读者会发现,在搜索栏上输入关键词之后,会显示出搜索的结果,小编想大多 ...

最新文章

  1. STL中的nth_element()方法的使用
  2. arm linux下编译库System.Net.Primitives.dll和System.Xml.XmlSerializer.dll
  3. php中延迟绑定,PHP静态延迟绑定
  4. ServiceComb开放性设计
  5. c++面向对象高级编程 学习九 pointer-like classes
  6. 上传头像mysql_上传头像 - MVC5+EF6+MySql企业网盘实战 - 爱整理
  7. Entity Framework 相关知识点合集
  8. linux改变时间 find,Find命令查找最近几天修改的文件
  9. 基于JAVA+SpringMVC+MYSQL的在线考试系统
  10. FakeAPP训练时错误【ResourceExhaustedError: OOM】解决方法
  11. 中兴助印尼Smartfren测试大规模MIMO技术
  12. 拆点并查集(poj 1182: 食物链)
  13. java中的枚举_Java中的枚举
  14. 编译器--简单数学表达式计算器(一)
  15. 设为首页 加入收藏 html,如何在网站上添加“设为首页”“加入收藏”
  16. IDispatch接口原理与应用
  17. C语言中的数组(4)---二维数组的定义
  18. 易中天品汉代风云人物02: 冤死的晁错(下)
  19. 深度学习基础学习-残差
  20. 卧槽?原来修出网红脸高清照片可以这样简单,这次把汉化的插件提供给大家!

热门文章

  1. 清华大学计算机系教授武汉理工大学,武汉理工大学
  2. 卡巴斯基KIS的激活方法
  3. 基于GA优化BP神经网络的传感器故障诊断算法matlab仿真
  4. 三级分销系统到底是什么模式,三级分销特点
  5. 网页密码查看器+原代码+windows密码查看
  6. Python+CLIP,令人惊叹的个性艺术表达
  7. 台湾东部海域发生有感地震 暂无灾情传出
  8. 功能安全 李艳文_如何理解功能安全管理
  9. 如何使用报表工具制作二维码报表
  10. UWA DAY 2021 议程亮相