如何通过python获取B站视频弹幕?

python版本:3.7.x
操作系统:windows

1.获取视频弹幕的av号与cid数据

av号我们可以从视频页面的url中获取!

在b站中,视频的弹幕文件我们可以通过cid数据进行访问,那么如何获取某视频的cid数据呢?
——通过f12审查元素获取
! Network→XHR→在Name中找heartbeat→往下翻即可找到cid值 (如图cid值为93165128)

——通过biliplus获取
在biliplus中,我们也可以通过b站av号,获取其相应的cid数据
但由于某些敏感问题,这里就不再介绍

2.获取弹幕的链接

将获取的cid数据填入{}(去掉{})
http://comment.bilibili.com/{cid}.xml
进入该网页可浏览所有弹幕

3.如何通过python将该文件保存在本地?(代码实现)

模块的调用
在这里我们需要通过requests库来获取网页的请求;通过beautifulsoup4来解析网址;通过lxml库来使用Xpath对HTML文档进行搜索;通过pandas来将其保存于本地的csv格式的文件

注意:若本地环境中未安装这些第三方模块,可通过pip进行自动安装

 pip install requestspip install beautifulsoup4pip install lxmlpip install pandas

模块顺利安装完毕后,就可以开始编写程序啦!
首先是模块的调用

 import requestsfrom bs4 import BeautifulSoupimport pandas as pd

访问弹幕数据

 url = 'http://comment.bilibili.com/93165128.xml'html = requests.get(url).content

对弹幕数据进行解析

 html_data = str(html,'utf-8')bs4 = BeautifulSoup(html_data,'lxml')results = bs4.find_all('d')comments = [comment.text for comment in results]comments_dict = {'comments':comments}

将弹幕文件保存于本地

 br = pd.DataFrame(comments_dict)br.to_csv('文件名.csv',encoding='utf-8')

运行代码,我们即可成功地将目标视频弹幕保存于本地,格式为CSV

注意:如果用pycharm保存的文件默认在我们建立的PythonProjects中

如何获取B站视频弹幕?相关推荐

  1. python 爬取B站视频弹幕信息

    获取B站视频弹幕,相对来说很简单,需要用到的知识点有requests.re两个库.requests用来获得网页信息,re正则匹配获取你需要的信息,当然还有其他的方法,例如Xpath. 进入你所观看的视 ...

  2. python获取b站视频封面及弹幕

    python网络爬虫 利用python获取b站视频封面及弹幕 获取弹幕 获取封面 完整代码 利用python获取b站视频封面及弹幕 获取弹幕 从https://api.bilibili.com/x/v ...

  3. 手把手教你使用Python获取B站视频并在本地实现弹幕播放功能

    点击上方"Python爬虫与数据挖掘",进行关注 回复"书籍"即可获赠Python从入门到进阶共10本电子书 今 日 鸡 汤 少小虽非投笔吏,论功还欲请长缨. ...

  4. python弹幕代码_只需3 行代码就可以获取B站(弹幕、评论、用户)数据

    在今年5月份,我写了一篇爬取B站视频的文章,今天给大家介绍一个获取B站数据的Python扩展库-bilibili_api,可以获取的数据包括: video-视频模块 user-用户模块 dynamic ...

  5. bilibili_api,仅用 3 行代码获取B站(弹幕、评论、用户)数据

    今天介绍一个获取B站数据的Python扩展库-bilibili_api 可以获取的数据包括: video-视频模块 user-用户模块 dynamic-动态模块 这次用"Running Ma ...

  6. python爬取bilibili弹幕_用Python爬取B站视频弹幕

    原标题:用Python爬取B站视频弹幕 via:菜J学Python 众所周知,弹幕,即在网络上观看视频时弹出的评论性字幕.不知道大家看视频的时候会不会点开弹幕,于我而言,弹幕是视频内容的良好补充,是一 ...

  7. 手把手教你使用Python网络爬虫获取B站视频选集内容(附源码)

    点击上方"Python爬虫与数据挖掘",进行关注 回复"书籍"即可获赠Python从入门到进阶共10本电子书 今 日 鸡 汤 位卑未敢忘忧国,事定犹须待阖棺. ...

  8. 如何免费获取B站视频字幕内容

    如何免费获取B站视频字幕内容 https://zhuanlan.zhihu.com/p/412835055

  9. python3抓取b站弹幕_python3写爬取B站视频弹幕功能

    需要准备的环境: 一个B站账号,需要先登录,否则不能查看历史弹幕记录 联网的电脑和顺手的浏览器,我用的Chrome Python3环境以及request模块,安装使用命令,换源比较快: pip3 in ...

  10. 用Python把B站视频弹幕爬下来,绘制词云图看看大家最关心什么!

    今天带大家做点好玩的,把B站热门视频弹幕爬下来制作词云图! 康康大家都怎么说! 开始之前先给大家啰嗦几句,可能有些兄弟不会安装模块,我大概讲一下. 如何安装模块: win(键盘左下角ctrl 和 Al ...

最新文章

  1. 【组队学习】【31期】数据可视化(Matplotlib)
  2. Application summary please elaborate on how you plan to use our API
  3. 颈部有细纹怎么缓解?
  4. netty实现mysql协议_基于Netty模拟解析Binlog
  5. 工作190:页面数据不显示
  6. 前端学习(1301):gulp建立任务csso和less
  7. Android学习之单选按钮
  8. 毕设题目:Matlab智能算法VRP(车辆路径规划)
  9. linux date命令 下月,Linux date命令用法和使用技巧(获取今天.昨天.一分钟前等)
  10. 基于SpringBoot的简单记账系统
  11. 【算法学堂】字符串基础算法
  12. 酒柜设计也可以很“特色”
  13. 生成登录验证码,点击更换验证码图片
  14. 安捷伦仪器仪表 - 程控总结
  15. python3 sorted()的用法
  16. 爬虫案例 --- Python 爬取淘宝数据存到数据库
  17. python二维数组求和_Python如何对二维数组求和
  18. python成语接龙代码_实现成语接龙(Python)
  19. zte手机android手机怎么刷机,ZTE中兴U880手机刷机详细图文教程
  20. CSS 学习成长笔记(1)

热门文章

  1. 表格里面如何快捷给方框内打勾
  2. Multimedia框架
  3. 嗨,你真得懂this吗?
  4. 线性代数可以速成吗_怎样速成线性代数?
  5. python 携程订单接口_携程api开发
  6. eclipse 选取当前行_Eclipse常用快捷键
  7. JAVA:实现求Median中位数算法(附完整源码)
  8. java 汇率换算_汇率转换示例代码
  9. win11+github pages+hexo+aurora主题搭建博客
  10. ​怎么判断是前端bug还是后端bug?