前言

本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理。

Python爬虫、数据分析、网站开发等案例教程视频免费在线观看

https://space.bilibili.com/523606542

基本开发环境

Python 3.6

Pycharm

相关模块的使用

import requests

斗鱼直播视频弹幕爬取分析

斗鱼就选择的直播视频,毕竟大主播弹幕发送会多一些。

复制其中一条弹幕,复制在开发者工具当中进行搜索。就可以看到相对应的弹幕数据。

一个url地址,是包含了500条弹幕数据。

url地址有三个参数:

vid:视频ID (不改变的)

start_time:视频开始的时间

end_time:不改变的

前500条弹幕数据开始的时间是0,就是从视频最开始的时候,下一个开始的时候是可以在数据中找到的。

end_time:500条弹幕数据结束的时间,那不就是下一次弹幕数据开始的时间嘛。

最后一次的弹幕url地址:end_time:-1 ,所以给一个判断跳出循环即可。

完整实现代码

importrequests

url= 'https://v.douyu.com/wgapi/vod/center/getBarrageList?vid=Bjq4MeYNqLxM5Ea8&start_time=0&end_time=-1'

whileTrue:

headers={'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'}

response= requests.get(url=url, headers=headers)

html_data=response.json()

next_time= html_data['data']['end_time']

lis= html_data['data']['list']for li inlis:

barrage= li['ctt']

with open('dy弹幕.txt', mode='a', encoding='utf-8') as f:

f.write(barrage)

f.write('\n')print(barrage)

url= f'https://v.douyu.com/wgapi/vod/center/getBarrageList?vid=Bjq4MeYNqLxM5Ea8&start_time={next_time}&end_time=-1'

if next_time == -1:break

总计弹幕数量:8627

词云效果

虎牙直播视频弹幕爬取分析

主播那肯定是选择

分析思路和斗鱼弹幕是一样的。

url地址有4个参数:

callback:可以不添加,不添加可以直接取json数据,添加之后就是字符串

vid:视频ID (不改变的)

beginTime:视频开始的时间

_:时间戳

下次开始的时间在数据接口中同样有。

完整实现代码

importrequestsimporttime

now_time= int(time.time() * 1000)

url= f'https://cxt.huya.com/open/danmu/timelist.do?vid=431927895&beginTime=0&_={now_time}'

whileTrue:

headers={'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'}

response= requests.get(url=url, headers=headers)

html_data=response.json()ifhtml_data:

nextBeginTime= html_data['nextBeginTime']

lis= html_data['list']for li inlis:

barrage= li['text']

with open('hy弹幕.txt', mode='a', encoding='utf-8') as f:

f.write(barrage)

f.write('\n')

url= f'https://cxt.huya.com/open/danmu/timelist.do?vid=431927895&beginTime={nextBeginTime}&_={now_time}'

print(nextBeginTime)else:break

总计弹幕数量:1280

词云效果

python获取虎牙弹幕_教你用20行代码爬取直播平台弹幕(附源码)相关推荐

  1. python爬取付费直播的视频_教你用20行代码爬取直播平台弹幕(附源码)

    前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. Python爬虫.数据分析.网站开发等案例教程视频免费在线观看 https://space. ...

  2. python:利用20行代码爬取网络小说

    文章目录 前言 一.爬虫是什么? 二.实现过程 总结 提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 前言 今天,来给大家一个分享一下如何使用20爬虫行代码爬取网络小说(这里我们以龙 ...

  3. python房子代码,Python---20行代码爬取斗鱼平台房间数据(上)

    本期用到json,requests库来爬取网页信息,这次爬的是一个特殊多页式网站,普通多页式网站只需分析不同页面的url,找出其中的不同点,用for in来循环即可,但是斗鱼的https://www. ...

  4. Python爬虫实战,requests+tqdm模块,爬取漫画数据(附源码)

    前言 今天给大家介绍的是Python爬取漫画数据,在这里给需要的小伙伴们代码,并且给出一点小心得. 首先是爬取之前应该尽可能伪装成浏览器而不被识别出来是爬虫,基本的是加请求头,但是这样的纯文本数据爬取 ...

  5. python 20行代码爬取王者荣耀全英雄皮肤

    引言 王者荣耀大家都玩过吧,没玩过的也应该听说过,作为时下最火的手机MOBA游戏,咳咳,好像跑题了.我们今天的重点是爬取王者荣耀所有英雄的所有皮肤,而且仅仅使用20行Python代码即可完成. 准备工 ...

  6. python写一个简单的爬虫程序(爬取快手)(附源码)

    快手是一个有意思的视频应用,但是它有一些视频不让下载,我们今天就用爬虫来实现爬取不让下载的视频: 首先右键点击检查,我们可以看见找到了视频的src,访问这个src就可以得到视频的下载网址,如下: 右键 ...

  7. 利用python爬取飞猪信息_Python---20行代码爬取斗鱼平台房间数据(下)-阿里云开发者社区...

    在上一篇中,已经详细的讲解了如何获取数据,接下来是深度处理数据,这里调用xlsxwriter库来制作Excel表格. 工具:Python3.6.5,Pycharm 1.模块介绍 XlsxWriter模 ...

  8. 强大的Python分析5000+抖音大V,几行代码发现大家都喜欢这类视频【源码分享】

    最近,小F在知乎上看到一个关于抖音的问题. 里面提到了,目前我国人均每天刷短视频110分钟. 看这数据,看来小F又被平均了. 不过老实说,只要一打开抖音,小F确实是有一种停不下来的感觉- 所以还是少刷 ...

  9. python爬斗鱼直播_Python---20行代码爬取斗鱼平台房间数据(下)

    在上一篇中,已经详细的讲解了如何获取数据,接下来是深度处理数据,这里调用xlsxwriter库来制作Excel表格. 工具:Python3.6.5,Pycharm 1.模块介绍 XlsxWriter模 ...

最新文章

  1. 图论500题 ---- (枚举+并查集)求图上路径权值差值最小 HDU find the most comfortable road
  2. 栈、堆、方法区之间的关系
  3. 高清重制版阿波罗11号录像,英伟达RTX还原50年前登月细节
  4. table选项卡从A页面点击进入B页面指定版块
  5. 批量删除Marketing Cloud里的contact
  6. 17秋 软件工程 团队第五次作业 Alpha Scrum3
  7. 8次c语言上机作业答案,计算机二级C语言上机题库及答案2017
  8. java ios rsa解密乱码_java与IOS之间的RSA加解密
  9. c++课程设计(水)
  10. 2022李宏毅机器学习hw2
  11. 2008 r2 php mysql_Win2008 R2 IIS7.5+PHP5(FastCGI)+MySQL5环境搭建教程
  12. winpe装双系统linux_自制WINPE+MAC安装U盘及双系统存储U盘(增加多系统安装)
  13. Java语言,基于TCP编写一个简单的Client/Server 网络应用程序。
  14. Android WiFi 连接 (Connect,no Internet,带叉)
  15. 眼睛血管分割matlab版本
  16. python win10 桌面_利用Python批量提取Win10锁屏壁纸实战教程
  17. 牛客每日练习----圆圈​​​​​​​,TaoTao要吃鸡,吐泡泡
  18. python处理csv文件里的空值_如何处理csv中的空值
  19. PPT基础教学(从PPT图片插入讲解的水平,真的不能再基础)
  20. carsim入门以及AEB的carsim参数设置

热门文章

  1. 基于安卓系统的SM4-SM2/3加解密软件开发报告
  2. 技术管理实战笔记-角色认知篇
  3. outlook仅限于此计算机如何解决,Outlook2013中IMAP方式已发送邮件、已删除邮件等文件夹注册失败...
  4. 华子20221012笔试第三题
  5. c语言odbc编程,c语言之odbc编程指南c语言之odbc编程指南.doc
  6. 什么是SaaS? 定义软件即服务
  7. Flash as3安全沙箱
  8. 智能家居行业发展趋势洞察
  9. 使用 git 创建补丁和打补丁。
  10. Chart.js入门:简介