现在某站的内容也可以爬取了,包括弹幕,评论,点赞,投币的功能.........,给大家介绍一个方便的库,方法如下:

第一步:安装

pip3 install bilibili-api-python

Python3.11 Windows 用户可能会遇到 lxml 安装失败的问题,可以直接用轮子(具体版本参照 requirements

接下来我们来获取视频的播放量等信息:

import asyncio
from bilibili_api import videoasync def main():# 实例化 Video 类v = video.Video(bvid="BV1uv411q7Mv")# 获取信息info = await v.get_info()# 打印信息print(info)if __name__ == '__main__':asyncio.get_event_loop().run_until_complete(main())

输出(已格式化,已省略部分):

{"bvid": "BV1uv411q7Mv","aid": 243922477,"videos": 1,"tid": 17,"tname": "单机游戏","copyright": 1,"pic": "http://i2.hdslb.com/bfs/archive/82e52df9d0221836c260c82f2890e3761a46716b.jpg","title": "爆肝98小时!在 MC 中还原糖调小镇","pubdate": 1595203214,"ctime": 1595168654,...and more
}

这个库还可以操作为视频点赞有兴趣的朋友可以参考上述地址,本文重点介绍弹幕内容的爬取:

'''
同步执行异步代码
考虑到有部分开发者有需要写同步代码的需求,亦或是简单的逻辑不想用异步,这里提供了一个很方便的异步转同步代码,使用方法如下:
'''


'''
同步执行异步代码
考虑到有部分开发者有需要写同步代码的需求,亦或是简单的逻辑不想用异步,这里提供了一个很方便的异步转同步代码,使用方法如下:
'''
from bilibili_api import sync, video
import reimport pandas as pd# 获取弹幕(需要提供的视频的aid)
v = video.Video(aid=293217914)
# print(sync(v.get_danmakus()))
danmu = sync(v.get_danmakus())
danmu_xml = sync(v.get_danmaku_xml())
print(danmu_xml)
file_name = '屋檐之夏第一集.csv'
# 数据处理
data = [data.text for data in danmu]
for i in data:i = re.sub('\s+', '', i)
# 查看数量
print("弹幕数量为:{}".format(len(data)))
# 输出到文件
df = pd.DataFrame(data)
df.to_csv(file_name, index=False, header=None, encoding="utf_8_sig")
print("写入文件成功")

某站弹幕抓取,视频,评论......相关推荐

  1. 【数据分析大作业 爬虫+数据清洗+可视化分析】Python抓取视频评论并生成词云、情感指数柱状图、性别比例饼图及评论信息表格

    目录 一些将BV号转化为AV号的变量设置 词云屏蔽词设置 使用代理IP(直接从IP网站复制的) 爬虫的函数 将结果写入表格中 下面是主函数,首先看看能不能抓取到,还有一些变量设置 开始循环爬评论 对一 ...

  2. Python抓取视频内容

    Python抓取视频内容 Python 是一种面向对象.解释型计算机程序设计语言,由Guido van Rossum于1989年底发明,第一个公开发行版发行于1991年.Python语法简洁而清晰,具 ...

  3. B站弹幕爬取并制成词云

    B站弹幕爬取并制成词云 前言 作为一个经济学学生,数据分析和可视化是一定要掌握的,从今天开始进行一些Python项目的记录,就不进行Python基础知识的讲解了! 一.B站弹幕的爬取 弹幕地址获取 i ...

  4. 强大的chrome(1)以acfun为例抓取视频

    chrome很强大,很强大,很强大. 想要了解他的强大呢,就先要掌握一些基本的chrome命令. 1. chrome://flags   可用来启用或者关闭某些chrome的体验特性   2. chr ...

  5. 用python爬虫下载视频_使用Python编写简单网络爬虫抓取视频下载资源

    我第一次接触爬虫这东西是在今年的5月份,当时写了一个博客搜索引擎,所用到的爬虫也挺智能的,起码比电影来了这个站用到的爬虫水平高多了! 回到用Python写爬虫的话题. Python一直是我主要使用的脚 ...

  6. 抖音弹幕抓取(适合纯小白)

    抖音弹幕抓取 准备代码 准备环境 运行 算是一个使用记录,代码和具体的环境配置已经有前辈写的很棒了,只是把这些整合到了一起,防止遗忘,也希望帮助到有需要的人. 准备代码 在github下载代码并解压, ...

  7. Bilibili直播弹幕抓取(1):WebSocket

    Bilibili直播弹幕抓取(1):WebSocket 转载自https://ihomura.cn/2018/05/14/Bilibili%E7%9B%B4%E6%92%AD%E5%BC%B9%E5% ...

  8. Bilibili直播弹幕抓取(3):弹幕传输协议分析

    转载自 https://ihomura.cn/2018/05/17/Bilibili%E7%9B%B4%E6%92%AD%E5%BC%B9%E5%B9%95%E6%8A%93%E5%8F%96-3-% ...

  9. 使用v4l2在树莓派上抓取视频图像

    最近学习使用v4l2在树莓派上抓取视频图像.有些收获,现在分享给大家. 操作的过程为:1.打开摄像头:2.获取摄像头的capability(它所支持的操作)3.获取摄像头支持哪些视频/图片帧格式:4. ...

最新文章

  1. 测试工程师工作流程概论
  2. 关于公司内部域名称是否要和外部真实域名称对应的问题
  3. 提升销售人员的信息处理能力
  4. 假设用于通信的电文由字符集{a,b,c,d,e,f,g}中的字母构成。 它们在电文中出现的频度分别为{0.31,0.16,0.10,0.08,0.11,0.20,0.04}。【MOOC答案】
  5. mysql调试.net_需要有关使用.NET和MySQL调试应用程序的帮助
  6. edoc2中标电子文件管理标准ERMS制定项目
  7. 4th, Jan 2012 食物中毒惊魂
  8. 对dedecms、php168,phpcms、VeryCMS、DiyPage五款开源整站系统的简单评点(
  9. J.U.C之并发工具类:Exchanger
  10. 吉林省高等学校计算机水平考试,关于2014年11月高等学校计算机水平考试(吉林省考区)报名的通知...
  11. 我的第一篇博客-缓存显示图片
  12. apple script to 1s screen capture snapshot w/ windowsill
  13. mysql导出txt数据_mysql导出和导入txt数据
  14. python 文件路径斜杠变成两道_Python文件操作---正斜杠与反斜杠
  15. mro列表_类的继承mro
  16. 女生节送什么礼物给女友,2022女生节送礼合集
  17. 华为交换机SNMPv2配置步骤
  18. 数学建模——计算机工具的使用(1)——SPSS操作以及在统计分析中的应用
  19. 【ArcGIS教程02】HTML弹窗挂接显示调研照片
  20. CodePush热更新常用命令与注意事项

热门文章

  1. 计算机视觉学习6_棋盘格_相机模型与参数标定
  2. EtherCat主站与从站简介
  3. 《转》关于ath5k网卡驱动中beacon的发送过程(特别是timestamp字段)
  4. MySQL Error:1677
  5. 如何做一个基于JAVA房产中介预约看房系统毕业设计毕设作品(springboot框架)
  6. Kafka的安装与配置
  7. 未明学院:管培生刚入职就被裁?校招的管培生真的那么高大上吗?
  8. FPGA通过PCIe读写DDR4仿真IP核
  9. 局域网bs虚拟服务器怎么创建,搭建局域网地图服务器
  10. 如何用地推进行有效获客降低成本提高效率?