刘华强买瓜是怎么火起来的?我用Python爬取了3000条B站视频才知道的!
最近B站这两个月,快被买瓜的刘华强屠版了,上一个这么火的人物,应该还是闪电五连鞭的马保国。
与之前的网络“审丑”视频不同,这次火的片段来自一部影视作品。
孙红雷在2003年主演的电视剧《征服》中,饰演一位名叫刘华强的黑帮老大,在一次买瓜的过程中他和商贩发生了争执,刘华强便一刀捅伤了瓜摊老板。
作为鬼畜区的资深爱好者,小五今天就用数据探究一下:刘华强买瓜什么时候火的?火成什么样?为什么这么火?
什么时候火的?
目前可以统计到的数据,刘华强买瓜相关的B站投稿视频已达数千条。
那么,究竟是什么时候开始成为一个爆款热点视频素材的呢?
数据获取
由于涉及数据采集,我们还是要搬出来老Python。
def get_videos(key_word, page_num):url = f'https://search.bilibili.com/video?keyword={key_word}&from_source=web_search&page={page_num}'r = requests.get(url, headers=headers, timeout=3)html = parsel.Selector(r.text)title = html.xpath('//li[@class="video-item matrix"]/a/@title').extract()upload_time = [i.strip() for i in html.xpath('//li[@class="video-item matrix"]//span[@title="上传时间"]/text()').extract()]view_num = [i.strip() for i in html.xpath('//li[@class="video-item matrix"]//span[@title="观看"]/text()').extract()]up_author = html.xpath('//li[@class="video-item matrix"]//span[@title="up主"]//a/text()').extract()video_url = html.xpath('//li[@class="video-item matrix"]/a/@href').extract()
爬取B站的视频数据:分别采集“刘华强”、“刘华强买瓜”等关键词在各个分区的投稿视频数据。
成功得到3000条数据,去重后是2659条bilibili视频投稿信息。
为了方便后续作图,还进行了一步数据处理,将播放量中的“万”转成数字。
下面,我们将依赖这2000条视频数据,来探究“刘华强买瓜”是怎么火起来的。
投稿视频
通过绘制每日视频发布数量的时间走势,可以发现
第一个高峰出现在7月16日,当天出现了25个相关投稿,明显高于前一天的5条视频
# 柱形图 bar1 = Bar(init_opts=opts.InitOpts(width='1000px', height='600px')) bar1.add_xaxis(time_num.index.tolist()) bar1.add_yaxis('', time_num.values.tolist()) bar1.set_global_opts(title_opts=opts.TitleOpts(title="当日发布视频的数量", subtitle="时间走势"), visualmap_opts=opts.VisualMapOpts(max_=77),) bar1.render_notebook()
那么,“刘华强买瓜”是在7月16日火起来的吗?
大概率不是。
当创作者们发现某个视频的素材非常有趣,再纷纷进行二创(蹭热点),肯定是要花一定时间的。
那么如何能找得最早引爆B站买瓜的视频呢?
这时,我想到了另一个方向——视频播放量。
播放量
改变方向,重新汇总每日投稿视频的总播放量,绘制折线图。
这次就很明显了,在7月14日总播放量达到810w,而之前的视频没有播放超过20w的。
那么,这个“引爆视频”作品就就是发布在——7月14日。
根据这个结果,我轻松找到了买瓜大队的“罪魁祸首”——【诚信商家】。
这样,第一个谜题就解开了,刘华强买瓜是在7月14日火起来的!
火成什么样?
探究完了什么时候火的,再来看看买瓜视频火成什么样了?
哪些up主又贡献了哪些优质的二创视频?
我按照播放量,制作了一张条形图。
TOP10中,【⚡萨 日 朗!!!⚡】名列前茅,播放量达到了2300w播放量,可见有多火!前文刚刚提到的,【诚信商家】也在其中,排名第10。
这些视频超级有趣,各位up主们脑洞都超级大:
在【买瓜大队】中刘华强一人买瓜可能有些寂寞,于是叫上了好几个同伙一起过来---祝瓜摊老板平安!
奥运期间,结合时事。水果忍者男单决赛,刘华强不负众望拿下金牌!
【无 伤 反 杀 刘 华 强】中,技术大佬把刘华强改成钢铁侠,凭借修改器还是成功“反杀”刘华强。
在「误导向」感人短片 【下 岗 工 人 刘 华 强】中,刘华强和瓜摊老板首次和解,共同演绎《杀死那个石家庄人》。
用一张假钞,买一个生瓜,如此生活30年,直到大厦崩塌。
为什么火?
我们已经了解到了,刘华强买瓜什么时候火的、火成什么样?那么为什么这么火,我决定去弹幕里找找答案!
不过当日弹幕只有300多条,不够爽
于是我再次拿起了Python,把最近30天的历史弹幕也爬了下来。
url = f'https://api.bilibili.com/x/v2/dm/web/history/seg.so?type=1&oid={oid_num}&date={danmu_date}'
按照被刘华强劈过的西瓜形状,制作了一张词云图
刘华强买瓜是怎么火起来的?我用Python爬取了3000条B站视频才知道的!相关推荐
- 小伙用Python爬取3000条B站视频,发现刘华强买瓜是这么火起来的!
大家好,我是小五???? 最近B站这两个月,快被买瓜的刘华强屠版了,上一个这么火的人物,应该还是闪电五连鞭的马保国. 与之前的网络"审丑"视频不同,这次火的片段来自一部影视作品. ...
- 我悄咪咪告诉你:罩杯越小的妹子倾向买越贵的内衣~~Python爬取京东9000条内衣销售数据之数据关联度分析
将爬取的9000条内衣销售数据整理清洗后,基于Apriori关联算法,针对"罩杯和消费价格倾向这两个元素有无关系"这个问题进行分析 上一篇用数据库清洗数据,点这里 再上一篇爬取数据 ...
- 干货(附源代码) | 爬取一万条b站评论,分析9.7分的新番凭啥这么火?
7月番<工作细胞>最终话在十一前放出.这部动漫在b站上评分高达9.7.除了口碑之外,热度也居高不下,更值得关注的是连很多平时不关注动漫的小伙伴也加入了追番大军.这次我们的目标是爬取b站上的 ...
- 刘华强买瓜(软件测试版)
文章目录 stage1: 华强:哥们儿,你这瓜多少钱1斤? 老板:2块钱1斤 →基础功能OK stage2: 华强:哥们儿,吸铁石多少钱1斤? 老板:NaN块钱1斤 华强:What's up! →出现 ...
- 华强买瓜-梵高星空限定版
文章目录 引言 效果展示 准备工作 具体步骤 业务逻辑 日志 转换风格 读取视频并保存每一帧 问题 引言 你这个模型, 它复现起来难吗? 我一水博客的, 能给你看复现不出来的算法? 效果展示 将梵高的 ...
- 通过python绘制华强买瓜的字符画视频
文章目录 读取视频 转为字符 动画 已经11月了,不知道还有没有人看华强买瓜...要把华强卖瓜做成字符视频,总共分为三步 读取视频 把每一帧转为字符画 把字符画表现出来 读取视频 通过imageio读 ...
- 电视剧《大秦赋》最近很火!于是我用Python抓取了“相关数据”,发现了这些秘密............
前言 最近,最火的电视剧莫过于<大秦赋了>,自12月1日开播后,收获了不错的口碑.然而随着电视剧的跟新,该剧在网上引起了激烈的讨论,不仅口碑急剧下滑,颇有高开低走的趋势,同时该剧的评分也由 ...
- python爬虫用什么电脑好_【Python】【爬虫】最近想买电脑,用Python爬取京东评论做个参考...
最近想换电脑,又有点不确定买哪一款.所以决定爬取京东上电脑评论,做个参考,并把最终结果绘制成词云图. 一.先来看下三款电脑评价的词云图 1 用Python爬取京东自营ThinkPad T490s的评论 ...
- 《大秦赋》最近很火!于是我用Python抓取了“相关数据”,发现了这些秘密.........
↑↑↑关注后"星标"简说Python 人人都可以简单入门Python.爬虫.数据分析 简说Python分享来源:数据分析与统计学之美 作者:黄伟呢One old watch, li ...
最新文章
- ​​​​​​​​​​​​​​使用dom方式遍历文档||获取元素||从元素中获取数据
- 怎么打开网卡rss_电脑任务栏右下角宽带图标提示网络电缆没插好怎么办?
- 图像算法中常用的数学概念
- c++ 实现录音并且指定到文件_2020年的办公装备新选择,搜狗AI录音笔E1深度评测...
- xmlreader php 读取某节点,php – 使用XMLReader选择父节点
- 【java】java 并发编程 BlockingQueue 和 BlockingDeque
- leetcode python3 简单题35. Search Insert Position
- 安装Win10,ERROR_0x8007025D问题解决
- 【sklearn第五讲】特征提取(上)
- sqlserver 2000 安装后本机如何连接_3030铝型材框架上的角槽连接件是如何安装固定的?...
- sentinel-2数据下载 大气校正 转ENVI格式
- python写邮箱验证工具_python应用POP3、IMAP、SMTP 协议,获取邮箱验证码
- 何宾 单片机原理及应用_stc单片机原理及应用.pdf
- wpf 客户端 添加qq客服咨询
- 机器学习的分类(监督学习、非监督学习、半监督学习)
- 内存不能为written或read的解决方案(比较简单)
- 2017.08.18【NOIP提高组】模拟赛B组 沙耶的玩偶(doll)
- Android自定义导览地图组件(二)
- tensorflow识别水果
- K210(SiPEED MaixBit)MicroPython使用参考(一、软硬件环境)
热门文章
- 小程序保存海报,canvas绘制然后保存到相册,canvas文字换行计算
- docker Compose 下载安装
- linux系统文件中转站(ftp服务)项目—实现在2台不同主机之间
- [附源码]Java计算机毕业设计SSM超市团购平台
- pthread售票多窗口共同C语言,基于C语言实现简单的12306火车售票系统
- 中间件:Nginx总结
- python毕业设计作品基于django框架校园排课选课系统毕设成品(7)中期检查报告
- c语言标准化考试系统课程设计,C语言课程设计单项选择题标准化考试系统.doc
- 利用html5读取本地文本文件及图片文件
- 人工智能学习教程笔记-5:数据清洗