抖音热搜及话题数据爬虫
祝大家元旦快乐 ! 新的一年里,
愿你脱去一身的疲惫,将精神振奋;
忘却一年的伤心,将快乐装备;
抖落一切的郁闷,将朝气携身;
愿你沐浴在友谊的阳光下,奋勇前进。
文章目录
- 抖音的热搜榜
- 热搜下对应的话题数据
- 指定话题的数据获取方法
- 代码部分
- 更新
我们准备实现的是抖音的热搜榜和话题的相关数据抓取。
抓包工具: charles
模拟器: 木木模拟器
抖音的热搜榜
一:可以直接通过抓包工具获取接口
将获取到的接口地址复制出来(简化后):
https://aweme-hl.snssdk.com/aweme/v1/hot/search/list/
接着就可以直接请求,来获取热搜数据了。
二:通过热搜的分享页面获取接口
点击右上角的分享选项,复制链接后,用浏览器打开。
在浏览器中打开后 https://www.iesdouyin.com/share/billboard/
同样也可以获取到接口地址。可直接进行get请求
https://www.iesdouyin.com/web/api/v2/hotsearch/billboard/word/
热搜下对应的话题数据
我们点击一个话题,来找一下热搜下对应的话题数据:
右上角的播放量数据在
https://aweme-hl.snssdk.com/aweme/v1/hot/search/list/?&source=3&os_api=23&version_code=860
我们通过寻找其他数据的接口,将链接复制下来(简化后):
https://aweme-hl.snssdk.com/aweme/v1/hot/search/video/list/?hotword=吴亦凡 脖子
想要的数据就有了,比如当前话题总参与人数,可以直接GET请求接口来解析数据。
热搜的数据很简单就可以获取到,
但是目前针对于指定话题,一些加密的参数还没有研究明白。欢迎大家留言交流
但是为了实现话题数据的抓取,不得不另寻他路,没想到还真找到了其他的接口。
指定话题的数据获取方法
以一个话题示例:
我们需要的是该话题对应的播放量和视频数量。
通过抓包,找到了如下接口:
https://aweme-hl.snssdk.com/aweme/v1/challenge/detail/?query_type=0&ch_id=1635753360881672
这里需要 ch_id 才能获取到我们需要的数据。
如何才能简单快捷的获取到这个ch_id呢,经过一段时间的分析。
我发现: 该话题《从地球出发》的ch_id:1635753360881672,
可以在该相关用户的详情中找到。
那么还是老方法,获取分享页面的链接,从浏览器打开
查看分享页面中的接口数据。
果不其然,找到了我们需要的id。
新的问题出现了,如何获取分享页面的详细数据,可以参考之前的博客:
感兴趣的朋友可以前往查看:抖音用户信息爬取案例
话题下的视频详情:
那么如何获取话题下的视频详情呢,回到模拟器,又发现了右上方的分享选项
将链接复制下来之后,使用浏览器打开,在接口中可以找到我们所需要的数据
https://www.iesdouyin.com/share/challenge/1635753360881672
观察一下这个接口的参数
ch_id 已经知道了,
_signature 签名,在之前的文章中有讲解过。这里就不再重复了。
感兴趣的朋友可以前往查看:抖音视频分享页面_signature
代码部分
案例代码,相对比较简介,需要大家自行完善。
热搜榜数据:
import requests
import pprint
# 抖音热搜榜
hot_search = 'https://aweme-hl.snssdk.com/aweme/v1/hot/search/list/?detail_list=1'
headers = {"User-Agent":"Mozilla/5.0 (Linux; Android 5.0; SM-G900P Build/LRX21T) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.88 Mobile Safari/537.36"}
hot_json = requests.get(hot_search,headers=headers).json()
hot_list = []
for data in hot_json['data']['word_list']:item = {}keyword = data['word']hot_value = data['hot_value']item[keyword] = hot_valuehot_list.append(item)
pprint.pprint(hot_list)
热搜词对应的阅读人数
这里取其中一个热搜词。
import requests
headers = {"User-Agent":"Mozilla/5.0 (Linux; Android 5.0; SM-G900P Build/LRX21T) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.88 Mobile Safari/537.36"}
hot_word = '鹿晗吃播'
hot_reading = 'https://aweme-hl.snssdk.com/aweme/v1/hot/search/video/list/?hotword={}'.format(hot_word)
hot_json = requests.get(hot_reading,headers=headers).json()
print("持续时间:",hot_json['aweme_list'][2]['duration'])
print("热度值:",hot_json['aweme_list'][2]['hot_info']['value'])
print("当前排名:",hot_json['aweme_list'][2]['hot_info']['rank'])
单个话题阅读量
import requests
dy_topic = 'https://aweme-hl.snssdk.com/aweme/v1/challenge/detail/?query_type=0&ch_id=1635753360881672'
headers = {"User-Agent":"Mozilla/5.0 (Linux; Android 5.0; SM-G900P Build/LRX21T) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.88 Mobile Safari/537.36"}
topic_json = requests.get(dy_topic,headers=headers).json()
view_count = topic_json['ch_info']['view_count'] # 阅读量
print(view_count)
如果对大家有帮助或者有疑问,欢迎点赞
抖音热搜及话题数据爬虫相关推荐
- 抖音热搜 API数据接口
抖音热搜 计费模式 免费额度 点数单价 每日限制 会员免费 100次 免费 10000次 更新时间:2022-07-11 02:52:38接口状态:正常 返回10条抖音App热点视频话题榜单数据 请求 ...
- 抖音热搜查询易语言代码
.版本 2 .子程序 __启动窗口_创建完毕 '添加并使用<精易模块> Send_API () .子程序 Send_API .局部变量 REQU_Data, 文本型, , , 提交字符串 ...
- android 热搜词 布局,Android FlowLayout流式布局打造热门标签(高仿抖音热搜)
需要先学习下面2个内容 1.已经基本给大家介绍了如何自定义ViewGroup,如果你还不了解 2.宽高的计算 一.XML布局 从布局图中可以看到,FlowLayout中包含了很多TextView.难度 ...
- java 抖音 热搜
拿走直接用 <!--Java的HTML解释器--><dependency><groupId>org.jsoup</groupId><artifac ...
- wpspbc按钮是什么意思_抖音私密账号什么意思 抖音热评私密账号什么梗怎么设置?...
日前,抖音热评里,又出现了一个叫私密账号的新梗,这是什么意思呢?抖音私密账号什么意思引发关注,抖音做为时下年轻人最喜爱的热门小视频软件,拥有上亿用户,有时候抖音里的一条热门评论,或是热门微博,都能引起 ...
- 极客日报:字节员工操纵抖音热榜被判刑;微信群聊可直接访问电商外链;JetBrains发布新一代编辑器Fleet
一分钟速览新闻点! 中国互联网企业综合实力指数(2021)发布:BAT仍列前三 微信群聊可直接访问电商外链 消息称美团智慧交通平台拆分,打车事业部独立 字节员工操纵抖音热榜被判刑 苹果再成为中国最大智 ...
- matplotlib-bilibili,抖音很火的动态数据视频自动生成(第四节)-视频,语音合成
" matplotlib-bilibili,抖音很火的动态数据视频自动生成(第四节)-视频,语音自动合成" 还记得上一节中我们所提到的数据动态视频吗?这次,为了让大家更加方便的制 ...
- 2023年最新最全uniCloud入门学习,零基础入门到实战项目 uni-admin打造uniapp网页后端 微信支付宝抖音小程序后端 unicloud数据后台快速打造uniapp小程序项目
今天开始带着大家一起零基础学习uniCloud,在下面的课程中我们就简称uniCloud为cloud吧.我这里从零基础开始教大家,后面可以带大家简单的做一个实战项目.所以不用担心自己没有基础,跟着石头 ...
- 19位主播带货破亿,83位达人涨粉百万,抖音近期还有哪些关键数据
5月横跨劳动节.母亲节和520几个重要营销节点,抖音生态蓬勃发展. 消费者购买意愿增强,直播电商销量突破10亿,销售额超500亿,多位主播带货转化翻倍,其中防蚊贴和洗衣凝珠成当月热销商品,除此之外,& ...
最新文章
- python列表用法详解(查找、添加、删除、修改、复制、循环遍历、列表嵌套)
- python 系统当前时间向前推2天_python 练习 后台返回当前时间
- Product生命周期
- 【机器学习基础】数学推导+纯Python实现机器学习算法14:Ridge岭回归
- 为什么java容器能在for each中遍历(Map除外)
- Android小测验感受
- 数据治理注意哪些问题
- 计算机主机拆解报告心得体会,计算机拆装实验报告心得体会(共10篇).doc
- pptv图标出现在计算机磁盘,PPTV出现界面乱码如何解决
- 越狱团队否认收钱并中止与太极合作
- matlab教程pdf,Matlab2010经典超强教程(清晰、版).pdf
- html怎么加入页面登录背景,HTML+CSS实现动态背景登录页面
- python与排版设计欣赏_有哪些排版惊艳的建筑作品集?
- eNSP华为模拟器使用——(11)eNSP模拟无线AC和AP
- linux 怎么格式化u盘写保护,u盘写保护无法格式化解决方法
- 把两张图片并排(行)显示的HTML代码
- 更新下来的vue项目如何跑起来
- 云呐|新兴行业中组织流程资产哪些的内容
- 让Octave支持中文
- Settings provider system和global表格数据访问
热门文章
- v-for 给每项绑定事件时,需要使用「事件代理」吗❓
- 力扣 481 神奇字符串
- python+pyecharts绘制股票k线图与日均收益率图
- jksv怎么导入_怪物猎人XX存档修改教程 教你怎么导入导出修改存档
- Android之乐学成语
- Centos7 安装配置MySQL5.7
- Dynamic Programming (动态规划问题)
- kali linux u盘 起不来,u盘怎么装系统步骤如下u盘安装kali linux 检测不到cd rom
- 2k19一直显示储存到服务器,NBA2K19画面设置保存不了解决方法_NBA2K19设置保存不了怎么办_玩游戏网...
- java settext 用不了_我一直无法解决方法'setText(java.lang.string)错误