如何获取B站视频弹幕?
如何通过python获取B站视频弹幕?
python版本:3.7.x
操作系统:windows
1.获取视频弹幕的av号与cid数据
av号我们可以从视频页面的url中获取!
在b站中,视频的弹幕文件我们可以通过cid数据进行访问,那么如何获取某视频的cid数据呢?
——通过f12审查元素获取
! Network→XHR→在Name中找heartbeat→往下翻即可找到cid值 (如图cid值为93165128)
——通过biliplus获取
在biliplus中,我们也可以通过b站av号,获取其相应的cid数据
但由于某些敏感问题,这里就不再介绍
2.获取弹幕的链接
将获取的cid数据填入{}(去掉{})
http://comment.bilibili.com/{cid}.xml
进入该网页可浏览所有弹幕
3.如何通过python将该文件保存在本地?(代码实现)
模块的调用
在这里我们需要通过requests库来获取网页的请求;通过beautifulsoup4来解析网址;通过lxml库来使用Xpath对HTML文档进行搜索;通过pandas来将其保存于本地的csv格式的文件
注意:若本地环境中未安装这些第三方模块,可通过pip进行自动安装
pip install requestspip install beautifulsoup4pip install lxmlpip install pandas
模块顺利安装完毕后,就可以开始编写程序啦!
首先是模块的调用
import requestsfrom bs4 import BeautifulSoupimport pandas as pd
访问弹幕数据
url = 'http://comment.bilibili.com/93165128.xml'html = requests.get(url).content
对弹幕数据进行解析
html_data = str(html,'utf-8')bs4 = BeautifulSoup(html_data,'lxml')results = bs4.find_all('d')comments = [comment.text for comment in results]comments_dict = {'comments':comments}
将弹幕文件保存于本地
br = pd.DataFrame(comments_dict)br.to_csv('文件名.csv',encoding='utf-8')
运行代码,我们即可成功地将目标视频弹幕保存于本地,格式为CSV
注意:如果用pycharm保存的文件默认在我们建立的PythonProjects中
如何获取B站视频弹幕?相关推荐
- python 爬取B站视频弹幕信息
获取B站视频弹幕,相对来说很简单,需要用到的知识点有requests.re两个库.requests用来获得网页信息,re正则匹配获取你需要的信息,当然还有其他的方法,例如Xpath. 进入你所观看的视 ...
- python获取b站视频封面及弹幕
python网络爬虫 利用python获取b站视频封面及弹幕 获取弹幕 获取封面 完整代码 利用python获取b站视频封面及弹幕 获取弹幕 从https://api.bilibili.com/x/v ...
- 手把手教你使用Python获取B站视频并在本地实现弹幕播放功能
点击上方"Python爬虫与数据挖掘",进行关注 回复"书籍"即可获赠Python从入门到进阶共10本电子书 今 日 鸡 汤 少小虽非投笔吏,论功还欲请长缨. ...
- python弹幕代码_只需3 行代码就可以获取B站(弹幕、评论、用户)数据
在今年5月份,我写了一篇爬取B站视频的文章,今天给大家介绍一个获取B站数据的Python扩展库-bilibili_api,可以获取的数据包括: video-视频模块 user-用户模块 dynamic ...
- bilibili_api,仅用 3 行代码获取B站(弹幕、评论、用户)数据
今天介绍一个获取B站数据的Python扩展库-bilibili_api 可以获取的数据包括: video-视频模块 user-用户模块 dynamic-动态模块 这次用"Running Ma ...
- python爬取bilibili弹幕_用Python爬取B站视频弹幕
原标题:用Python爬取B站视频弹幕 via:菜J学Python 众所周知,弹幕,即在网络上观看视频时弹出的评论性字幕.不知道大家看视频的时候会不会点开弹幕,于我而言,弹幕是视频内容的良好补充,是一 ...
- 手把手教你使用Python网络爬虫获取B站视频选集内容(附源码)
点击上方"Python爬虫与数据挖掘",进行关注 回复"书籍"即可获赠Python从入门到进阶共10本电子书 今 日 鸡 汤 位卑未敢忘忧国,事定犹须待阖棺. ...
- 如何免费获取B站视频字幕内容
如何免费获取B站视频字幕内容 https://zhuanlan.zhihu.com/p/412835055
- python3抓取b站弹幕_python3写爬取B站视频弹幕功能
需要准备的环境: 一个B站账号,需要先登录,否则不能查看历史弹幕记录 联网的电脑和顺手的浏览器,我用的Chrome Python3环境以及request模块,安装使用命令,换源比较快: pip3 in ...
- 用Python把B站视频弹幕爬下来,绘制词云图看看大家最关心什么!
今天带大家做点好玩的,把B站热门视频弹幕爬下来制作词云图! 康康大家都怎么说! 开始之前先给大家啰嗦几句,可能有些兄弟不会安装模块,我大概讲一下. 如何安装模块: win(键盘左下角ctrl 和 Al ...
最新文章
- 【组队学习】【31期】数据可视化(Matplotlib)
- Application summary please elaborate on how you plan to use our API
- 颈部有细纹怎么缓解?
- netty实现mysql协议_基于Netty模拟解析Binlog
- 工作190:页面数据不显示
- 前端学习(1301):gulp建立任务csso和less
- Android学习之单选按钮
- 毕设题目:Matlab智能算法VRP(车辆路径规划)
- linux date命令 下月,Linux date命令用法和使用技巧(获取今天.昨天.一分钟前等)
- 基于SpringBoot的简单记账系统
- 【算法学堂】字符串基础算法
- 酒柜设计也可以很“特色”
- 生成登录验证码,点击更换验证码图片
- 安捷伦仪器仪表 - 程控总结
- python3 sorted()的用法
- 爬虫案例 --- Python 爬取淘宝数据存到数据库
- python二维数组求和_Python如何对二维数组求和
- python成语接龙代码_实现成语接龙(Python)
- zte手机android手机怎么刷机,ZTE中兴U880手机刷机详细图文教程
- CSS 学习成长笔记(1)