获取B站视频弹幕,相对来说很简单,需要用到的知识点有requests、re两个库。requests用来获得网页信息,re正则匹配获取你需要的信息,当然还有其他的方法,例如Xpath。
进入你所观看的视频的页面,F12进入开发者工具,选择网络。查找我们需要的信息,发现域名那列有comment.bilibili.com 格式为xml ,文件名即为cid号。点击它后,在右边的消息头中复制请求网址,在浏览器中打开,即可获得视频全部弹幕信息。

  

代码如下:

 1 import requests
 2 import re
 3 def getHTML(av):
 4     url='https://comment.bilibili.com/'+av+'.xml'
 5     html=requests.get(url)
 6     comments=html.text
 7     res=r'>(.+?)</d>'
 8     rescom=re.compile(res)
 9     comment=re.findall(rescom,comments)
10     for row in comment:
11         print(row)
12 av=input("input your av:")
13 getHTML(av)

弹幕代码

运行代码,弹幕就全部打印到窗口中,另外关于获取评论以及用评论内容制作词云可查看博客。

原创不易,尊重版权。转载请注明出处:http://www.cnblogs.com/xsmile/

转载于:https://www.cnblogs.com/xsmile/p/8006386.html

python 爬取B站视频弹幕信息相关推荐

  1. python爬取bilibili弹幕_用Python爬取B站视频弹幕

    原标题:用Python爬取B站视频弹幕 via:菜J学Python 众所周知,弹幕,即在网络上观看视频时弹出的评论性字幕.不知道大家看视频的时候会不会点开弹幕,于我而言,弹幕是视频内容的良好补充,是一 ...

  2. python爬取B站视频弹幕分析并制作词云

    1.分析网页 视频地址: www.bilibili.com/video/BV19E- 本身博主同时也是一名up主,虽然已经断更好久了,但是不妨碍我爬取弹幕信息来分析呀. 这次我选取的是自己 唯一的爆款 ...

  3. python爬取b站评论_学习笔记(1):写了个python爬取B站视频评论的程序

    学习笔记(1):写了个python爬取B站视频评论的程序 import requests import json import os table='fZodR9XQDSUm21yCkr6zBqiveY ...

  4. python爬取抖音用户数据_使用python爬取抖音视频列表信息

    如果看到特别感兴趣的抖音vlogger的视频,想全部dump下来,如何操作呢?下面介绍介绍如何使用python导出特定用户所有视频信息 抓包分析 Chrome Deveploer Tools Chro ...

  5. python爬b站评论_学习笔记(1):写了个python爬取B站视频评论的程序

    学习笔记(1):写了个python爬取B站视频评论的程序 import requests import json import os table='fZodR9XQDSUm21yCkr6zBqiveY ...

  6. python爬取b站直播弹幕代码

    以下是使用Python爬取B站直播弹幕的代码示例: import requests import json import timedef get_real_url(room_id):# 获取直播间的真 ...

  7. python爬取腾讯视频弹幕_用Python爬取腾讯视频弹幕

    原标题:用Python爬取腾讯视频弹幕 via:菜J学Python 1.网页分析 本文以爬取<脱口秀大会 第3季>最后一期视频弹幕为例,首先通过以下步骤找到存放弹幕的真实url. 通过删减 ...

  8. Python 爬取B站视频信息 弹幕信息 生成词云统计

    本文介绍功能:实现爬取B站视频信息(用户输入关键词).爬取弹幕信息(支持自定义天数).生成词云图 完整代码地址:https://github.com/736755244/py_bilibili 一.数 ...

  9. python视频网站分类_用Python爬取b站视频

    本文概要 爬取B站视频的办法在csdn和B站有很多 但是本文算作是对爬取步骤的一个拆解 同时也算是我的笔记.本代码的参考对象是https://blog.csdn.net/Mr_Ohahah/artic ...

最新文章

  1. Linux上的gitlab日常操作
  2. Unicode和UTF-8的区别
  3. 初次就这么给了你(Django-rest-framework)
  4. 线性代数【1】线性代数是什么【2】行列式计算【3】行列式性质【特殊行列计算】【4】克莱姆法则
  5. 怎样成为一名A“.NET研究”ndroid开发者
  6. 研发管理---(1)持续交付
  7. RDS SQL Server - 专题分享 - 巧用执行计划缓存之Table Scan
  8. echarts3Dearth 地球数据可视化添加 tooltip效果和涟漪扩散的效果
  9. c++写入二进制、TXT文件,读取二进制、TXT文件,切分字符串(入数组)
  10. HTML5 SVG蝴蝶飞舞动画3D效果
  11. 把电脑做成服务器系统,把电脑做成云盘服务器
  12. 我们为你精选了一份Jupyter/IPython笔记本集合 !(附大量资源链接)-上篇
  13. Springboot+WebSocket实现匿名聊天室
  14. eclipse 安装jetty WTP Adaptor插件
  15. Java学习笔记:SQL数据排序
  16. 2023最新计算机毕业设计题目汇总大全
  17. 使用Firefox+Tor+FoxyProxy+Noscript+IETab进行安全自由的网上冲浪
  18. 光纤通信系统组成总结及相干光通信基础
  19. visio2010 去除跨线
  20. 其实性格决定命运,细节决定成败,知识改变命运,学习成就未来,观念决定行动,思维决定出路,态度决定一切

热门文章

  1. 文件夹遍历的非递归实现
  2. appliedzkp的zkevm(3)Word Encoding
  3. 并行程序设计导论pdf电子书_并行程序设计导论学习笔记——OpenMP(1)
  4. 教务系统开发(PHP+MySQL)
  5. Rockland 抗HA标签抗体说明书
  6. ffmpeg视频格式解读
  7. EA下载问题解决方案
  8. 超标量处理器设计——第七章_寄存器重命名
  9. t460p加固态硬盘 thinkpad_电脑小白的Thinkpad T460P升级之路
  10. 采用IEEE33节点配电网进行仿真,搭建了含风光,储能,柴油发电机和燃气轮机的配电网经济调度模型