祝大家元旦快乐 ! 新的一年里,
愿你脱去一身的疲惫,将精神振奋;
忘却一年的伤心,将快乐装备;
抖落一切的郁闷,将朝气携身;
愿你沐浴在友谊的阳光下,奋勇前进。


文章目录

  • 抖音的热搜榜
  • 热搜下对应的话题数据
  • 指定话题的数据获取方法
  • 代码部分
  • 更新

我们准备实现的是抖音的热搜榜和话题的相关数据抓取。
抓包工具: charles
模拟器: 木木模拟器


抖音的热搜榜

一:可以直接通过抓包工具获取接口

将获取到的接口地址复制出来(简化后):
https://aweme-hl.snssdk.com/aweme/v1/hot/search/list/

接着就可以直接请求,来获取热搜数据了。

二:通过热搜的分享页面获取接口
点击右上角的分享选项,复制链接后,用浏览器打开。


在浏览器中打开后 https://www.iesdouyin.com/share/billboard/

同样也可以获取到接口地址。可直接进行get请求
https://www.iesdouyin.com/web/api/v2/hotsearch/billboard/word/

热搜下对应的话题数据

我们点击一个话题,来找一下热搜下对应的话题数据:
右上角的播放量数据在
https://aweme-hl.snssdk.com/aweme/v1/hot/search/list/?&source=3&os_api=23&version_code=860


我们通过寻找其他数据的接口,将链接复制下来(简化后):
https://aweme-hl.snssdk.com/aweme/v1/hot/search/video/list/?hotword=吴亦凡 脖子

想要的数据就有了,比如当前话题总参与人数,可以直接GET请求接口来解析数据。


热搜的数据很简单就可以获取到,
但是目前针对于指定话题,一些加密的参数还没有研究明白。欢迎大家留言交流

但是为了实现话题数据的抓取,不得不另寻他路,没想到还真找到了其他的接口。

指定话题的数据获取方法

以一个话题示例:

我们需要的是该话题对应的播放量和视频数量。
通过抓包,找到了如下接口:
https://aweme-hl.snssdk.com/aweme/v1/challenge/detail/?query_type=0&ch_id=1635753360881672

这里需要 ch_id 才能获取到我们需要的数据。
如何才能简单快捷的获取到这个ch_id呢,经过一段时间的分析。
我发现: 该话题《从地球出发》的ch_id:1635753360881672,
可以在该相关用户的详情中找到。

那么还是老方法,获取分享页面的链接,从浏览器打开

查看分享页面中的接口数据。

果不其然,找到了我们需要的id。
新的问题出现了,如何获取分享页面的详细数据,可以参考之前的博客:

感兴趣的朋友可以前往查看:抖音用户信息爬取案例


话题下的视频详情:
那么如何获取话题下的视频详情呢,回到模拟器,又发现了右上方的分享选项

将链接复制下来之后,使用浏览器打开,在接口中可以找到我们所需要的数据

https://www.iesdouyin.com/share/challenge/1635753360881672

观察一下这个接口的参数

ch_id 已经知道了,
_signature 签名,在之前的文章中有讲解过。这里就不再重复了。

感兴趣的朋友可以前往查看:抖音视频分享页面_signature


代码部分

案例代码,相对比较简介,需要大家自行完善。

热搜榜数据:

import requests
import pprint
# 抖音热搜榜
hot_search = 'https://aweme-hl.snssdk.com/aweme/v1/hot/search/list/?detail_list=1'
headers = {"User-Agent":"Mozilla/5.0 (Linux; Android 5.0; SM-G900P Build/LRX21T) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.88 Mobile Safari/537.36"}
hot_json = requests.get(hot_search,headers=headers).json()
hot_list = []
for data in hot_json['data']['word_list']:item = {}keyword = data['word']hot_value = data['hot_value']item[keyword] = hot_valuehot_list.append(item)
pprint.pprint(hot_list)


热搜词对应的阅读人数
这里取其中一个热搜词。

import requests
headers = {"User-Agent":"Mozilla/5.0 (Linux; Android 5.0; SM-G900P Build/LRX21T) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.88 Mobile Safari/537.36"}
hot_word = '鹿晗吃播'
hot_reading = 'https://aweme-hl.snssdk.com/aweme/v1/hot/search/video/list/?hotword={}'.format(hot_word)
hot_json = requests.get(hot_reading,headers=headers).json()
print("持续时间:",hot_json['aweme_list'][2]['duration'])
print("热度值:",hot_json['aweme_list'][2]['hot_info']['value'])
print("当前排名:",hot_json['aweme_list'][2]['hot_info']['rank'])


单个话题阅读量

import requests
dy_topic = 'https://aweme-hl.snssdk.com/aweme/v1/challenge/detail/?query_type=0&ch_id=1635753360881672'
headers = {"User-Agent":"Mozilla/5.0 (Linux; Android 5.0; SM-G900P Build/LRX21T) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.88 Mobile Safari/537.36"}
topic_json = requests.get(dy_topic,headers=headers).json()
view_count = topic_json['ch_info']['view_count'] # 阅读量
print(view_count)

如果对大家有帮助或者有疑问,欢迎点赞

抖音热搜及话题数据爬虫相关推荐

  1. 抖音热搜 API数据接口

    抖音热搜 计费模式 免费额度 点数单价 每日限制 会员免费 100次 免费 10000次 更新时间:2022-07-11 02:52:38接口状态:正常 返回10条抖音App热点视频话题榜单数据 请求 ...

  2. 抖音热搜查询易语言代码

    .版本 2 .子程序 __启动窗口_创建完毕 '添加并使用<精易模块> Send_API () .子程序 Send_API .局部变量 REQU_Data, 文本型, , , 提交字符串 ...

  3. android 热搜词 布局,Android FlowLayout流式布局打造热门标签(高仿抖音热搜)

    需要先学习下面2个内容 1.已经基本给大家介绍了如何自定义ViewGroup,如果你还不了解 2.宽高的计算 一.XML布局 从布局图中可以看到,FlowLayout中包含了很多TextView.难度 ...

  4. java 抖音 热搜

    拿走直接用 <!--Java的HTML解释器--><dependency><groupId>org.jsoup</groupId><artifac ...

  5. wpspbc按钮是什么意思_抖音私密账号什么意思 抖音热评私密账号什么梗怎么设置?...

    日前,抖音热评里,又出现了一个叫私密账号的新梗,这是什么意思呢?抖音私密账号什么意思引发关注,抖音做为时下年轻人最喜爱的热门小视频软件,拥有上亿用户,有时候抖音里的一条热门评论,或是热门微博,都能引起 ...

  6. 极客日报:​​​字节员工操纵抖音热榜被判刑;微信群聊可直接访问电商外链;JetBrains发布新一代编辑器Fleet

    一分钟速览新闻点! 中国互联网企业综合实力指数(2021)发布:BAT仍列前三 微信群聊可直接访问电商外链 消息称美团智慧交通平台拆分,打车事业部独立 字节员工操纵抖音热榜被判刑 苹果再成为中国最大智 ...

  7. matplotlib-bilibili,抖音很火的动态数据视频自动生成(第四节)-视频,语音合成

    " matplotlib-bilibili,抖音很火的动态数据视频自动生成(第四节)-视频,语音自动合成" 还记得上一节中我们所提到的数据动态视频吗​?这次,为了让大家更加方便的制 ...

  8. 2023年最新最全uniCloud入门学习,零基础入门到实战项目 uni-admin打造uniapp网页后端 微信支付宝抖音小程序后端 unicloud数据后台快速打造uniapp小程序项目

    今天开始带着大家一起零基础学习uniCloud,在下面的课程中我们就简称uniCloud为cloud吧.我这里从零基础开始教大家,后面可以带大家简单的做一个实战项目.所以不用担心自己没有基础,跟着石头 ...

  9. 19位主播带货破亿,83位达人涨粉百万,抖音近期还有哪些关键数据

    5月横跨劳动节.母亲节和520几个重要营销节点,抖音生态蓬勃发展. 消费者购买意愿增强,直播电商销量突破10亿,销售额超500亿,多位主播带货转化翻倍,其中防蚊贴和洗衣凝珠成当月热销商品,除此之外,& ...

最新文章

  1. python列表用法详解(查找、添加、删除、修改、复制、循环遍历、列表嵌套)
  2. python 系统当前时间向前推2天_python 练习 后台返回当前时间
  3. Product生命周期
  4. 【机器学习基础】数学推导+纯Python实现机器学习算法14:Ridge岭回归
  5. 为什么java容器能在for each中遍历(Map除外)
  6. Android小测验感受
  7. 数据治理注意哪些问题
  8. 计算机主机拆解报告心得体会,计算机拆装实验报告心得体会(共10篇).doc
  9. pptv图标出现在计算机磁盘,PPTV出现界面乱码如何解决
  10. 越狱团队否认收钱并中止与太极合作
  11. matlab教程pdf,Matlab2010经典超强教程(清晰、版).pdf
  12. html怎么加入页面登录背景,HTML+CSS实现动态背景登录页面
  13. python与排版设计欣赏_有哪些排版惊艳的建筑作品集?
  14. eNSP华为模拟器使用——(11)eNSP模拟无线AC和AP
  15. linux 怎么格式化u盘写保护,u盘写保护无法格式化解决方法
  16. 把两张图片并排(行)显示的HTML代码
  17. 更新下来的vue项目如何跑起来
  18. 云呐|新兴行业中组织流程资产哪些的内容
  19. 让Octave支持中文
  20. Settings provider system和global表格数据访问

热门文章

  1. v-for 给每项绑定事件时,需要使用「事件代理」吗❓
  2. 力扣 481 神奇字符串
  3. python+pyecharts绘制股票k线图与日均收益率图
  4. jksv怎么导入_怪物猎人XX存档修改教程 教你怎么导入导出修改存档
  5. Android之乐学成语
  6. Centos7 安装配置MySQL5.7
  7. Dynamic Programming (动态规划问题)
  8. kali linux u盘 起不来,u盘怎么装系统步骤如下u盘安装kali linux 检测不到cd rom
  9. 2k19一直显示储存到服务器,NBA2K19画面设置保存不了解决方法_NBA2K19设置保存不了怎么办_玩游戏网...
  10. java settext 用不了_我一直无法解决方法'setText(java.lang.string)错误