介绍一下

这是我的第一个练手爬虫项目,不用Python,Excel就可以搞定奥!

1、打开想要抓取弹幕的视频网址

在这里我用到的网站是Firefox,本来用的是goole,但是在goole上一直找不到XML格式的文件。

2、解析网站

F12或者右击选择“检查/查看元素”,召唤控制台
点击“网络/network” ⇨⇨⇨ 在“类型”那一列下找到xml双击 ⇨⇨⇨ 复制网址打开就是弹幕消息啦

3、分析得到数据

<d p="99.61200,1,25,16777215,1543892663,0,eb5d683e,8782080176029696">哈哈哈哈哈哈哈</d>

99.61200 弹幕出现的时间以秒为单位
1 弹幕类型(1-跑马灯,4-底部)
25 字体
16777215 颜色
1543892663 Unix时间戳,基准时间为 1970.01.01,日期=(Unix时间戳+83600)/86400+70365+闰天
0 弹幕池(0-普通池 1-字幕池 2-特殊池)
eb5d683e 用户ID
8782080176029696 唯一标识

4、数据导入Excel

下一步我是利用Excel 进行的数据导入
复制网址放入新建的Word中,文件格式选择.txt,命名为xxx.iqy

然后打开Excel–数据–获取外部数据–进行Web查询–选择刚才保存的文件,导入就可以了

没用的数据可以删掉,红框的数据便是我们上边分析的数据,对其进行整理
之后自己按照上述数据代表分析数据,个性化取舍就好

爬取 bilibili 弹幕数据相关推荐

  1. 菜鸟弟弟从零开始的爬取Bilibili弹幕的Python爬虫教程-哔哩哔哩 - ( ゜- ゜)つロ 干杯~

    从零开始的爬取Bilibili弹幕的Python爬虫教程 或许可以作为一个爬虫小白的练手的demo? 还是先看看什么是爬虫吧!(还有Bilibili! ) 网络爬虫: 网络爬虫(又称为网页蜘蛛,网络机 ...

  2. 爬取 bilibili 纪录片数据数据可视化

    爬取 bilibili 纪录片数据&数据可视化 说起纪录片就不得不提拉我入坑"冰冻星球"."地球脉动"等国外神作,但是说到中国的纪录片,除了" ...

  3. python爬取bilibili弹幕_Python爬虫爬取Bilibili弹幕过程解析

    先来思考一个问题,B站一个视频的弹幕最多会有多少? 比较多的会有2000条吧,这么多数据,B站肯定是不会直接把弹幕和这个视频绑在一起的. 也就是说,有一个视频地址为https://www.bilibi ...

  4. python爬取bilibili弹幕_Python抓取BiliBili拦河坝并生成单词云,爬取,bilibili,弹幕

    木秀于林,风亦惧之:虽为萤火,亦绽光芒. Python爬取bilibili弹幕并生成词云 目标网站: 哔哩哔哩: https://www.bilibili.com/ 我这里以 TES vs SN 第四 ...

  5. Python爬虫:爬取Bilibili弹幕过程示例代码

    这篇文章主要介绍了Python爬虫爬取Bilibili弹幕过程解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 先来思考一个问题,B站一个视频的弹 ...

  6. python爬取bilibili弹幕_用Python爬取B站视频弹幕

    原标题:用Python爬取B站视频弹幕 via:菜J学Python 众所周知,弹幕,即在网络上观看视频时弹出的评论性字幕.不知道大家看视频的时候会不会点开弹幕,于我而言,弹幕是视频内容的良好补充,是一 ...

  7. 今天分享个用Python爬虫爬取Bilibili弹幕的小例子解析

    先来思考一个问题,B站一个视频的弹幕最多会有多少? 比较多的会有2000条吧,这么多数据,B站肯定是不会直接把弹幕和这个视频绑在一起的. 也就是说,有一个视频地址为 https://www.bilib ...

  8. python爬取bilibili弹幕_python爬虫:bilibili弹幕爬取+词云生成

    如果你懒得看下边的文字,我录了一个完整的教学视频在b站上. 我的B站教学:https://www.bilibili.com/video/av75377135?p=2 工作原理 b站是提供弹幕接口的,所 ...

  9. 超详细爬取bilibili视频数据

    1.爬虫心得 1.我们在写爬虫程序的时候可以采用面向对象的方式进行代码构造,使得代码结构更加清晰 2.放我们发现某个网站的PC端网页比较难爬的时候,我们可以查看其手机端是否好爬 3.本爬虫程序解析的文 ...

  10. python爬取bilibili弹幕_GitHub - yxwangnju/Bilibili-Bullet-Screen-Crawler: 一个爬取bilibili上弹幕的简单python程序...

    Bilibili Bullet Screen Crawler 用python语言实现了一个简单的哔哩哔哩弹幕爬虫程序. 1. 运行环境 python 3 and higher versions. 运行 ...

最新文章

  1. 闲来无事,总结 Xcode常用快捷键
  2. linux下创建多进程,linux之多进程fork:进程创建
  3. MVC中如何使用语音识别功能实现输入
  4. 【组件】大数据框架安装功能来划分
  5. SQLi LABS Less 14 报错注入+布尔盲注
  6. 【数据库系统设计】关系数据库标准语言SQL(3)
  7. 将循环结果写入到新建的dataframe中
  8. vue全局组件中再创建多个组件
  9. sniffer抓包工具(中文版+视频教程)
  10. 信息差暴利副业项目,让你日入500+
  11. 【评论精选】关于冯东阳被淘宝索赔一千万事件的用户评论
  12. 喝王老吉可延长寿命大约10%?
  13. 卡莱特led显示屏调试教程_如何使用卡莱特软件点亮LED电子显示屏
  14. 苹果登陆代理方法didCompleteWithAuthorization没有调用,didCompleteWithError没有走
  15. opencv与C++实现最大类间方差法(OTSU)进行图像二值化
  16. if中return语句作用/条件判断中如何退出函数
  17. 在html文件中url称之为什么,html+css网页设计复习题
  18. 光学时钟“升天”助力卫星精准导航
  19. 视频号常见问题五连问(15)
  20. 20170506 《摔跤吧,爸爸》观影笔记

热门文章

  1. 改wifi密码显示服务器拒绝访问权限,wifi密码对但是拒绝接入? | 192路由网
  2. 魅族16 USB连接计算机,在魅族16x中连接电脑的方法分享
  3. 类和对象的基础2——对象的生与死(构造函数和析构函数)
  4. multisim异或门
  5. 数据分析学习总结笔记01:情感分析
  6. 继电器控制电路原理解析说明
  7. html5跳跳蛙小游戏分析,中班科学优秀教案《跳跳蛙》(5页)-原创力文档
  8. 一个MOS 电平转换电路引发的思考可避免更多的坑
  9. java dns缓存清理_清除DNS缓存信息方法
  10. 压缩卷时可压缩空间远小于实际剩余空间解决方法