获取B站视频排行榜的一些数据,例如标题、UP主、分区、BV号、播放量、弹幕量、评论量、综合得分等

同时将视频封面保存到本地

import re
import requests
import os
from requests.packages.urllib3.exceptions import InsecureRequestWarning
requests.packages.urllib3.disable_warnings(InsecureRequestWarning)url="https://www.bilibili.com/v/popular/rank/all"
img_list=[] # 图片链接
name_list=[] # 标题
tname_list=[] # 分区
view_list=[] # 播放量
up_list=[] # UP名
pinglun_list=[] # 评论量
socre_list=[] # 综合得分
bv_list=[] # bv号def get_URL():headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.81 Safari/537.36'}response = requests.get(url=url, headers=headers, verify=False)content = response.content.decode('utf-8')return contentdef get_IMG():content=get_URL()pattern = re.compile(r'"pic":"(.*?)","title"')imgdata_list = pattern.findall(content)for img in imgdata_list:img = img.encode('utf-8').decode('unicode_escape')img_list.append(img)print("封面链接: ")print(img_list)def get_otherinfo():content = get_URL()# 视频标题pattern_name = re.compile(r'class="title">(.*?)</a>')name_list = pattern_name.findall(content)print("视频标题: ")print(name_list)# UP主名称pattern_upname = re.compile(r'"name":"(.*?)"')up_list = pattern_upname.findall(content)print("UP主名称: ")print(up_list)# 视频类型/分区pattern_tname = re.compile(r'"tname":"(.*?)"')tname_list = pattern_tname.findall(content)print("视频分区:")print(tname_list)# 播放量pattern_view = re.compile(r'"view":(.*?)"')view_list = pattern_view.findall(content)print("播放量:")print(view_list)# 弹幕量pattern_danmu = re.compile(r'"danmaku":(.*?)"')danmu_list = pattern_danmu.findall(content)print("弹幕量:")print(danmu_list)# BV号pattern_bv = re.compile(r'com/video/(.*?)" target="')bv_list = pattern_bv.findall(content)print("BV号:")print(bv_list)# 综合得分pattern_bv = re.compile(r'<div>(.*?)</div>综合得分')bv_list = pattern_bv.findall(content)print("综合得分:")print(bv_list)# "reply":114550,"favorite":76574,"coin":320357,"share":64088,""like":362596,"dislike":0}# 回复,收藏,硬币,分享,点赞,踩
def download():root = "pic/"for i in range(len(img_list)):path = root+str(i)+"."+'png'# 判断文件夹是否存在if not os.path.exists(root):os.mkdir(root)if not os.path.exists(path):# 发送请求r = requests.get(img_list[i])with open(path, 'wb') as f:f.write(r.content)f.close()if __name__ == '__main__':get_IMG()download()get_otherinfo()

Python练习:爬取B站排行榜数据相关推荐

  1. python爬虫爬取豆瓣电影排行榜并通过pandas保存到Excel文件当中

    我们的需求是利用python爬虫爬取豆瓣电影排行榜数据,并将数据通过pandas保存到Excel文件当中(步骤详细) 我们用到的第三方库如下所示: import requests import pan ...

  2. python爬取知乎话题广场_学习python爬虫---爬虫实践:爬取B站排行榜2(爬取全部分类排行榜、利用pygal库作图)...

    前面我们爬取了B站上全站的排行榜,详细见:魏勇:学习python爬虫---爬虫实践:爬取B站排行榜​zhuanlan.zhihu.com 一.爬取全部分类排行榜 我们观察一下B站排行榜,那里还有番剧排 ...

  3. 【Python爬虫】用Python爬取娱乐圈排行榜数据

      想关注你的爱豆最近在娱乐圈发展的怎么样吗?本文和你一起爬取娱乐圈的排行榜数据,来看看你的爱豆现在排名变化情况,有几次登顶,几次进了前十名呀. PS:在下一篇文章中分析排行榜的动态变化趋势,并绘制成 ...

  4. python爬取b站用户_python爬取b站排行榜

    爬取b站排行榜并存到mysql中 目的 b站是我平时看得最多的一个网站,最近接到了一个爬虫的课设.首先要选择一个网站,并对其进行爬取,最后将该网站的数据存储并使其可视化. 网站的结构 目标网站:bil ...

  5. 从入门到入土:Python实现爬取某站视频|根据视频编号|支持通过视频名称和创作者名称寻找编号|以及python moviepy合并音频视频

    写在前面: 此博客仅用于记录个人学习进度,学识浅薄,若有错误观点欢迎评论区指出.欢迎各位前来交流.(部分材料来源网络,若有侵权,立即删除) Python实现爬取某站视频|根据视频编号|支持通过视频名称 ...

  6. 基于Webmagic的爬取B站用户数据的爬虫

    基于Webmagic的爬取B站用户数据的爬虫 github: https://github.com/Al-assad/Spider-bilibiliUser-active 数据示例样本:http:// ...

  7. Python爬取B站排行榜前100视频信息!

    前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. PS:如有需要Python学习资料的小伙伴可以加点击下方链接自行获取 python免费学习资 ...

  8. Python番外篇:爬取CSDN作者排行榜数据

    今天,又双叒叕是番外篇,我们来爬取CSDN作者排行榜上的数据. 1. 确定数据源 首先,排行榜的网页链接是https://blog.csdn.net/rank/list/total: 打开" ...

  9. Python爬取B站排行榜前100视频信息

    前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. PS:如有需要Python学习资料的小伙伴可以加点击下方链接自行获取 python免费学习资 ...

最新文章

  1. luogu P1027 Car的旅行路线
  2. (十一)开发环境【不会这些,你就会被认定是菜鸟小白,没做过项目】
  3. mysql的innodb如何定位锁问题_mysql的innodb如何定位锁问题,mysql如何减少主从复制延迟?...
  4. 在即将发布的Camel 2.21版本中改进了使用Apache Camel和ActiveMQ Artemis处理大型消息的功能...
  5. ComponentOne FlexGrid for WinForms 中文版快速入门(4)--设置单元格格式
  6. 中国新时代贡献人物_关于如何鼓励新贡献者的8个新博客文章
  7. Resharper插件如何启用原VS的智能提示
  8. 计算机类中外合作办学情况,郑州大学2021年河南省本科一批各专业录取分数统计...
  9. 罗永浩向老同事道歉;三星漏洞已波及四千万用户;Clojure 1.11 即将发布 | 极客头条...
  10. 借助Sigar API获取磁盘信息
  11. Java调用Memcache入门
  12. apollocaffe编译问题
  13. 如何在CSDN中免费下载资料
  14. 三菱PLC编程软件Work2的FB块加密后的解密方法
  15. 空间计量经济学(2)---广义空间自回归与空间误差模型
  16. 习题——路由与交换机技术(五)
  17. Gartner发布2022年中国智慧城市和可持续发展技术成熟度曲线
  18. 学习秦始皇 五招打造无敌团队
  19. Python 数据扩充(亮度、翻转、噪声)
  20. Matlab常用技巧

热门文章

  1. 《元宇宙发展与治理》课题调研 齐心构建“元宇宙世界”蓝图
  2. 总结一下这两天的学习笔记
  3. 头条项目---01项目介绍和工程搭建
  4. 计算机软件硬件最核心的,计算机硬件系统最核心的是什么,计算机硬件最核心部件...
  5. Javascript--04 JavaScript的内部对象
  6. pc端和移动端微信加入群聊的测试用例设计点
  7. 前端中常用的一个标准的表格模板
  8. iconfont字体图标下载
  9. 2021年全球聚二甲基二烯丙基氯化铵收入大约252.5百万美元,预计2028年达到307.8百万美元,2022至2028期间,年复合增长率CAGR为 %。同时2020年全球聚二甲基二烯丙基氯化铵销量大
  10. 【计算机网络】以太网供电PoE - Power over Ethernet