主要思路

对PandaTV直播间抓包分析得出的结论有:

(1)通过GET请求获取弹幕服务器地址;

(2)和弹幕服务器建立WebSocket连接后的具体过程需要在主页面引用的JS文件中找(建立连接、发心跳包、解压弹幕消息);

(3)WebSocket中传输的json对象为明文形式。

开发工具

Python版本:3.5.4

相关模块:

requests模块以及一些Python自带的模块。

环境搭建

安装Python并添加到环境变量,pip安装需要的相关模块即可。

使用方式

(1)直接运行

功能:

根据输入的房间号,显示该房间实时弹幕。

若需其他功能请自行修改源代码。

CTRL+C键可停止程序运行。

首页随便找个房间演示下,如下图所示:

(2)作为模块导入

使用方式如下图所示:

说明与简单实例

返回的弹幕数据格式为:

不是特别了解直播平台里这些东西是什么意思,了解了貌似也没什么用,因此对其他数据有兴趣的请自行了解获取其含义。

写了个将用户昵称及其发言内容存入excel中的脚本作为简单实例。

运行方式如下图所示:

结果保存在results文件夹中,默认以房间号命名:

源码获取私信小编01

Python爬取pandaTV弹幕,弹幕真是人才多啊!相关推荐

  1. Python爬取B站弹幕方法介绍

    Python爬取B站弹幕方法介绍 文章目录 Python爬取B站弹幕方法介绍 前言 寻找弹幕数据 编写爬虫 B站弹幕数量 新技术介绍 参考文章 前言 最近同学要做东西,需要用 B 站的视频对应的弹幕数 ...

  2. python接收弹幕_闲着没事,尝试一下用Python爬取B站弹幕呀~

    原标题:闲着没事,尝试一下用Python爬取B站弹幕呀~ 前言 最近同学要做东西,需要用 B 站的视频对应的弹幕数据做分析,于是请我帮忙爬取 B 站视频的弹幕数据. 对于爬虫而言,我们需要找到对应数据 ...

  3. 萌新学习Python爬取B站弹幕+R语言分词demo说明

    代码地址如下: http://www.demodashi.com/demo/11578.html 一.写在前面 之前在简书首页看到了Python爬虫的介绍,于是就想着爬取B站弹幕并绘制词云,因此有了这 ...

  4. 用Python爬取B站弹幕并做成词云

    用Python爬取B站弹幕并做成词云 一.获取视频的cid号 1.进入想爬的视频,打开浏览器设置里的"开发者工具": 进入NetWork后等待requests刷出,数据够了后可随意 ...

  5. python爬取b站弹幕并进行数据可视化

    python爬取b站弹幕并进行数据可视化 1.第一步,爬取b站弹幕 我们随便打开一个b站视频 打开开发者模式,在network下搜索list,可以找到该视频的弹幕文件 打开之后是这个样子的 结构还是比 ...

  6. python爬取b站弹幕分析_B站弹幕爬取原理解析(python)

    感谢 原理 概念 cid : 爬取弹幕需要的id号,可以由BV号通过API接口获得 步骤BV转cid 浏览器输入:https://api.bilibili.com/x/player/pagelist? ...

  7. Python爬取B站弹幕+Gephi梳理主线剧情

    作者 | 皖渝 出品 | 凹凸数据(ID:alltodata) 头图 |  CSDN 下载自东方IC 爬取介绍 利用 Chrome 浏览器抓包可知,B站的弹幕文件以 XML 文档式进行储存,如下所示( ...

  8. python爬取b站弹幕_如何爬取B站弹幕

    前言 主要记录自己完成爬虫的思路:从how to do到what to do这是一个拿 python 练手的项目,虽说是入门级,但其余爬虫也万变不离其宗 ̄へ ̄ [源代码地址 Github:bili-d ...

  9. Python爬取视频网站弹幕,并做成词云图

    本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. 作者:张同学 来源:凹凸数据 Python爬虫.数据分析.网站开发等案例教程vb.net教程视频免 ...

  10. python爬取b站弹幕分析_如何爬取b站弹幕文件

    我们知道编写一个爬虫之前最重要的是进行网页结构的分析,确定你要抓取的部分是属于网页结构的哪一部分.以"你绝对没听过的梁朝伟唱歌 一开口就苏了 可惜被梁家辉开腔了"为例子,打开谷歌浏 ...

最新文章

  1. Java中的 Switch 是如何支持 String 的?为什么不支持 long?
  2. 【小技巧积累】设置ListView控件的Item不在Tab键导航序列中
  3. 徐州技师学院计算机程序设计,徐州技师学院2021年有哪些专业
  4. 【做题记录】区间排序—线段树
  5. 服务器复制不了文档,服务器复制粘贴不了
  6. Hbase 二级索引 Solr int字段排序问题 can not sort on multivalued field
  7. python语言发明者 google_看看9种编程语言的发明者是怎么说的
  8. Oracle学习 第20天 PL/SQL导入
  9. 自适应模糊PID(位置式)C语言实现
  10. IDEA 可以提神开发效率的插件
  11. 【校园网环境下知网研学下载文献出现“下载文献 当前IP没有获取权限或服务器异常”处理办法】
  12. if前面加个#是什么意思?c++中#if与if的比较
  13. 《金融学》笔记 第一章 货币的本质
  14. 解决类似微信聊天界面软键盘和表情框冲突问题
  15. [io_uring][自用] io_uring.pdf DeepL机翻
  16. Android S关闭定位开关后,定位权限被AppOps限制。
  17. 印象笔记桌面便签关闭后找回
  18. 华为手机无法安装ADB和HDB的处理
  19. KEIL软件错误代码及错误信息
  20. 天龙八部TLBB系列 - 网单获取数据库密码和服务端密码(超简单)

热门文章

  1. vmware安装升级Linux内核,vm下linux内核升级实例
  2. 一步步教你打造属于自己的FLV播放器,动态调用外部影片!~
  3. B2C模式电商案例-用户注册与登录
  4. VTM3.0代码阅读:xDeriveCUMV函数
  5. CAD快速进入到手机及地图叠加(导入外业精灵、导入图新地球、导入GlobalMapper、CAD转tif、CAD转mbt、CAD转KML)
  6. 人均34万!腾讯奖励员工11亿元股票,网友:别人家的公司
  7. Android中如何监听手机GPS打开状态
  8. 记一次kafka线上事故
  9. 金蝶kis记账王凭证处理要注意的几点
  10. CSS3字体火焰燃烧效果