最近B站这两个月,快被买瓜的刘华强屠版了,上一个这么火的人物,应该还是闪电五连鞭的马保国。

与之前的网络“审丑”视频不同,这次火的片段来自一部影视作品。

孙红雷在2003年主演的电视剧《征服》中,饰演一位名叫刘华强的黑帮老大,在一次买瓜的过程中他和商贩发生了争执,刘华强便一刀捅伤了瓜摊老板。

​作为鬼畜区的资深爱好者,小五今天就用数据探究一下:刘华强买瓜什么时候火的?火成什么样?为什么这么火?

什么时候火的?

目前可以统计到的数据,刘华强买瓜相关的B站投稿视频已达数千条。

那么,究竟是什么时候开始成为一个爆款热点视频素材的呢?

数据获取

由于涉及数据采集,我们还是要搬出来老Python。

def get_videos(key_word, page_num):url = f'https://search.bilibili.com/video?keyword={key_word}&from_source=web_search&page={page_num}'r = requests.get(url, headers=headers, timeout=3)html = parsel.Selector(r.text)title = html.xpath('//li[@class="video-item matrix"]/a/@title').extract()upload_time = [i.strip() for i in html.xpath('//li[@class="video-item matrix"]//span[@title="上传时间"]/text()').extract()]view_num = [i.strip() for i in html.xpath('//li[@class="video-item matrix"]//span[@title="观看"]/text()').extract()]up_author = html.xpath('//li[@class="video-item matrix"]//span[@title="up主"]//a/text()').extract()video_url = html.xpath('//li[@class="video-item matrix"]/a/@href').extract()

爬取B站的视频数据:分别采集“刘华强”、“刘华强买瓜”等关键词在各个分区的投稿视频数据。

成功得到3000条数据,去重后是2659条bilibili视频投稿信息。

为了方便后续作图,还进行了一步数据处理,将播放量中的“万”转成数字。

​下面,我们将依赖这2000条视频数据,来探究“刘华强买瓜”是怎么火起来的。

投稿视频

通过绘制每日视频发布数量的时间走势,可以发现

第一个高峰出现在7月16日,当天出现了25个相关投稿,明显高于前一天的5条视频

# 柱形图
bar1 = Bar(init_opts=opts.InitOpts(width='1000px', height='600px'))
bar1.add_xaxis(time_num.index.tolist())
bar1.add_yaxis('', time_num.values.tolist())
bar1.set_global_opts(title_opts=opts.TitleOpts(title="当日发布视频的数量", subtitle="时间走势"), visualmap_opts=opts.VisualMapOpts(max_=77),)
bar1.render_notebook()

那么,“刘华强买瓜”是在7月16日火起来的吗?

大概率不是。

当创作者们发现某个视频的素材非常有趣,再纷纷进行二创(蹭热点),肯定是要花一定时间的。

那么如何能找得最早引爆B站买瓜的视频呢?

​这时,我想到了另一个方向——视频播放量。

播放量

改变方向,重新汇总每日投稿视频的总播放量,绘制折线图。

这次就很明显了,在7月14日总播放量达到810w,而之前的视频没有播放超过20w的。

那么,这个“引爆视频”作品就就是发布在——7月14日

​​

根据这个结果,我轻松找到了买瓜大队的“罪魁祸首”——【诚信商家】。

这样,第一个谜题就解开了,刘华强买瓜是在7月14日火起来的!

火成什么样?

探究完了什么时候火的,再来看看买瓜视频火成什么样了?

哪些up主又贡献了哪些优质的二创视频?

我按照播放量,制作了一张条形图。

​TOP10中,【⚡萨 日 朗!!!⚡】名列前茅,播放量达到了2300w播放量,可见有多火!前文刚刚提到的,【诚信商家】也在其中,排名第10。

这些视频超级有趣,各位up主们脑洞都超级大:

在【买瓜大队】中刘华强一人买瓜可能有些寂寞,于是叫上了好几个同伙一起过来---祝瓜摊老板平安!

​奥运期间,结合时事。水果忍者男单决赛,刘华强不负众望拿下金牌!​

​【无 伤 反 杀 刘 华 强】中,技术大佬把刘华强改成钢铁侠,凭借修改器还是成功“反杀”刘华强。​

​在「误导向」感人短片 【下 岗 工 人 刘 华 强】中,刘华强和瓜摊老板首次和解,共同演绎《杀死那个石家庄人》。​

​用一张假钞,买一个生瓜,如此生活30年,直到大厦崩塌。

为什么火?

我们已经了解到了,刘华强买瓜什么时候火的、火成什么样?那么为什么这么火,我决定去弹幕里找找答案!

不过当日弹幕只有300多条,不够爽

于是我再次拿起了Python,把最近30天的历史弹幕也爬了下来。

url = f'https://api.bilibili.com/x/v2/dm/web/history/seg.so?type=1&oid={oid_num}&date={danmu_date}'

按照被刘华强劈过的西瓜形状,制作了一张词云图

刘华强买瓜是怎么火起来的?我用Python爬取了3000条B站视频才知道的!相关推荐

  1. 小伙用Python爬取3000条B站视频,发现刘华强买瓜是这么火起来的!

    大家好,我是小五???? 最近B站这两个月,快被买瓜的刘华强屠版了,上一个这么火的人物,应该还是闪电五连鞭的马保国. 与之前的网络"审丑"视频不同,这次火的片段来自一部影视作品. ...

  2. 我悄咪咪告诉你:罩杯越小的妹子倾向买越贵的内衣~~Python爬取京东9000条内衣销售数据之数据关联度分析

    将爬取的9000条内衣销售数据整理清洗后,基于Apriori关联算法,针对"罩杯和消费价格倾向这两个元素有无关系"这个问题进行分析 上一篇用数据库清洗数据,点这里 再上一篇爬取数据 ...

  3. 干货(附源代码) | 爬取一万条b站评论,分析9.7分的新番凭啥这么火?

    7月番<工作细胞>最终话在十一前放出.这部动漫在b站上评分高达9.7.除了口碑之外,热度也居高不下,更值得关注的是连很多平时不关注动漫的小伙伴也加入了追番大军.这次我们的目标是爬取b站上的 ...

  4. 刘华强买瓜(软件测试版)

    文章目录 stage1: 华强:哥们儿,你这瓜多少钱1斤? 老板:2块钱1斤 →基础功能OK stage2: 华强:哥们儿,吸铁石多少钱1斤? 老板:NaN块钱1斤 华强:What's up! →出现 ...

  5. 华强买瓜-梵高星空限定版

    文章目录 引言 效果展示 准备工作 具体步骤 业务逻辑 日志 转换风格 读取视频并保存每一帧 问题 引言 你这个模型, 它复现起来难吗? 我一水博客的, 能给你看复现不出来的算法? 效果展示 将梵高的 ...

  6. 通过python绘制华强买瓜的字符画视频

    文章目录 读取视频 转为字符 动画 已经11月了,不知道还有没有人看华强买瓜...要把华强卖瓜做成字符视频,总共分为三步 读取视频 把每一帧转为字符画 把字符画表现出来 读取视频 通过imageio读 ...

  7. 电视剧《大秦赋》最近很火!于是我用Python抓取了“相关数据”,发现了这些秘密............

    前言 最近,最火的电视剧莫过于<大秦赋了>,自12月1日开播后,收获了不错的口碑.然而随着电视剧的跟新,该剧在网上引起了激烈的讨论,不仅口碑急剧下滑,颇有高开低走的趋势,同时该剧的评分也由 ...

  8. python爬虫用什么电脑好_【Python】【爬虫】最近想买电脑,用Python爬取京东评论做个参考...

    最近想换电脑,又有点不确定买哪一款.所以决定爬取京东上电脑评论,做个参考,并把最终结果绘制成词云图. 一.先来看下三款电脑评价的词云图 1 用Python爬取京东自营ThinkPad T490s的评论 ...

  9. 《大秦赋》最近很火!于是我用Python抓取了“相关数据”,发现了这些秘密.........

    ↑↑↑关注后"星标"简说Python 人人都可以简单入门Python.爬虫.数据分析 简说Python分享来源:数据分析与统计学之美 作者:黄伟呢One old watch, li ...

最新文章

  1. ​​​​​​​​​​​​​​使用dom方式遍历文档||获取元素||从元素中获取数据
  2. 怎么打开网卡rss_电脑任务栏右下角宽带图标提示网络电缆没插好怎么办?
  3. 图像算法中常用的数学概念
  4. c++ 实现录音并且指定到文件_2020年的办公装备新选择,搜狗AI录音笔E1深度评测...
  5. xmlreader php 读取某节点,php – 使用XMLReader选择父节点
  6. 【java】java 并发编程 BlockingQueue 和 BlockingDeque
  7. leetcode python3 简单题35. Search Insert Position
  8. 安装Win10,ERROR_0x8007025D问题解决
  9. 【sklearn第五讲】特征提取(上)
  10. sqlserver 2000 安装后本机如何连接_3030铝型材框架上的角槽连接件是如何安装固定的?...
  11. sentinel-2数据下载 大气校正 转ENVI格式
  12. python写邮箱验证工具_python应用POP3、IMAP、SMTP 协议,获取邮箱验证码
  13. 何宾 单片机原理及应用_stc单片机原理及应用.pdf
  14. wpf 客户端 添加qq客服咨询
  15. 机器学习的分类(监督学习、非监督学习、半监督学习)
  16. 内存不能为written或read的解决方案(比较简单)
  17. 2017.08.18【NOIP提高组】模拟赛B组 沙耶的玩偶(doll)
  18. Android自定义导览地图组件(二)
  19. tensorflow识别水果
  20. K210(SiPEED MaixBit)MicroPython使用参考(一、软硬件环境)

热门文章

  1. 小程序保存海报,canvas绘制然后保存到相册,canvas文字换行计算
  2. docker Compose 下载安装
  3. linux系统文件中转站(ftp服务)项目—实现在2台不同主机之间
  4. [附源码]Java计算机毕业设计SSM超市团购平台
  5. pthread售票多窗口共同C语言,基于C语言实现简单的12306火车售票系统
  6. 中间件:Nginx总结
  7. python毕业设计作品基于django框架校园排课选课系统毕设成品(7)中期检查报告
  8. c语言标准化考试系统课程设计,C语言课程设计单项选择题标准化考试系统.doc
  9. 利用html5读取本地文本文件及图片文件
  10. 人工智能学习教程笔记-5:数据清洗