爬取 bilibili 弹幕数据
介绍一下
这是我的第一个练手爬虫项目,不用Python,Excel就可以搞定奥!
1、打开想要抓取弹幕的视频网址
在这里我用到的网站是Firefox,本来用的是goole,但是在goole上一直找不到XML格式的文件。
2、解析网站
F12或者右击选择“检查/查看元素”,召唤控制台
点击“网络/network” ⇨⇨⇨ 在“类型”那一列下找到xml双击 ⇨⇨⇨ 复制网址打开就是弹幕消息啦
3、分析得到数据
<d p="99.61200,1,25,16777215,1543892663,0,eb5d683e,8782080176029696">哈哈哈哈哈哈哈</d>
99.61200 | 弹幕出现的时间以秒为单位 |
---|---|
1 | 弹幕类型(1-跑马灯,4-底部) |
25 | 字体 |
16777215 | 颜色 |
1543892663 | Unix时间戳,基准时间为 1970.01.01,日期=(Unix时间戳+83600)/86400+70365+闰天 |
0 | 弹幕池(0-普通池 1-字幕池 2-特殊池) |
eb5d683e | 用户ID |
8782080176029696 | 唯一标识 |
4、数据导入Excel
下一步我是利用Excel 进行的数据导入
复制网址放入新建的Word中,文件格式选择.txt,命名为xxx.iqy
然后打开Excel–数据–获取外部数据–进行Web查询–选择刚才保存的文件,导入就可以了
没用的数据可以删掉,红框的数据便是我们上边分析的数据,对其进行整理
之后自己按照上述数据代表分析数据,个性化取舍就好
爬取 bilibili 弹幕数据相关推荐
- 菜鸟弟弟从零开始的爬取Bilibili弹幕的Python爬虫教程-哔哩哔哩 - ( ゜- ゜)つロ 干杯~
从零开始的爬取Bilibili弹幕的Python爬虫教程 或许可以作为一个爬虫小白的练手的demo? 还是先看看什么是爬虫吧!(还有Bilibili! ) 网络爬虫: 网络爬虫(又称为网页蜘蛛,网络机 ...
- 爬取 bilibili 纪录片数据数据可视化
爬取 bilibili 纪录片数据&数据可视化 说起纪录片就不得不提拉我入坑"冰冻星球"."地球脉动"等国外神作,但是说到中国的纪录片,除了" ...
- python爬取bilibili弹幕_Python爬虫爬取Bilibili弹幕过程解析
先来思考一个问题,B站一个视频的弹幕最多会有多少? 比较多的会有2000条吧,这么多数据,B站肯定是不会直接把弹幕和这个视频绑在一起的. 也就是说,有一个视频地址为https://www.bilibi ...
- python爬取bilibili弹幕_Python抓取BiliBili拦河坝并生成单词云,爬取,bilibili,弹幕
木秀于林,风亦惧之:虽为萤火,亦绽光芒. Python爬取bilibili弹幕并生成词云 目标网站: 哔哩哔哩: https://www.bilibili.com/ 我这里以 TES vs SN 第四 ...
- Python爬虫:爬取Bilibili弹幕过程示例代码
这篇文章主要介绍了Python爬虫爬取Bilibili弹幕过程解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 先来思考一个问题,B站一个视频的弹 ...
- python爬取bilibili弹幕_用Python爬取B站视频弹幕
原标题:用Python爬取B站视频弹幕 via:菜J学Python 众所周知,弹幕,即在网络上观看视频时弹出的评论性字幕.不知道大家看视频的时候会不会点开弹幕,于我而言,弹幕是视频内容的良好补充,是一 ...
- 今天分享个用Python爬虫爬取Bilibili弹幕的小例子解析
先来思考一个问题,B站一个视频的弹幕最多会有多少? 比较多的会有2000条吧,这么多数据,B站肯定是不会直接把弹幕和这个视频绑在一起的. 也就是说,有一个视频地址为 https://www.bilib ...
- python爬取bilibili弹幕_python爬虫:bilibili弹幕爬取+词云生成
如果你懒得看下边的文字,我录了一个完整的教学视频在b站上. 我的B站教学:https://www.bilibili.com/video/av75377135?p=2 工作原理 b站是提供弹幕接口的,所 ...
- 超详细爬取bilibili视频数据
1.爬虫心得 1.我们在写爬虫程序的时候可以采用面向对象的方式进行代码构造,使得代码结构更加清晰 2.放我们发现某个网站的PC端网页比较难爬的时候,我们可以查看其手机端是否好爬 3.本爬虫程序解析的文 ...
- python爬取bilibili弹幕_GitHub - yxwangnju/Bilibili-Bullet-Screen-Crawler: 一个爬取bilibili上弹幕的简单python程序...
Bilibili Bullet Screen Crawler 用python语言实现了一个简单的哔哩哔哩弹幕爬虫程序. 1. 运行环境 python 3 and higher versions. 运行 ...
最新文章
- 闲来无事,总结 Xcode常用快捷键
- linux下创建多进程,linux之多进程fork:进程创建
- MVC中如何使用语音识别功能实现输入
- 【组件】大数据框架安装功能来划分
- SQLi LABS Less 14 报错注入+布尔盲注
- 【数据库系统设计】关系数据库标准语言SQL(3)
- 将循环结果写入到新建的dataframe中
- vue全局组件中再创建多个组件
- sniffer抓包工具(中文版+视频教程)
- 信息差暴利副业项目,让你日入500+
- 【评论精选】关于冯东阳被淘宝索赔一千万事件的用户评论
- 喝王老吉可延长寿命大约10%?
- 卡莱特led显示屏调试教程_如何使用卡莱特软件点亮LED电子显示屏
- 苹果登陆代理方法didCompleteWithAuthorization没有调用,didCompleteWithError没有走
- opencv与C++实现最大类间方差法(OTSU)进行图像二值化
- if中return语句作用/条件判断中如何退出函数
- 在html文件中url称之为什么,html+css网页设计复习题
- 光学时钟“升天”助力卫星精准导航
- 视频号常见问题五连问(15)
- 20170506 《摔跤吧,爸爸》观影笔记