不会吧、不会吧,不会还有朋友没看《隐秘的角落》吧,如果没有断网的话,最近朋友圈、微博等都应该被这部只有十二集的国产网剧刷屏了。开播初豆瓣评分就已经达到9.0,甚至一度窜到9.2,要知道国产电视剧过9分的都寥寥无几,更何况还只是一部网剧,可能绝大部分人与这部剧本无缘,但是选择看剧的契机也正是这超高的评分。

经过朋友圈和微博的强烈安利,又在高评分的诱惑下,和家人一天刷完了这部神剧,看完这部剧主要有两个感受:

  • 全员演技都在线
  • 细~真的细、细到爆炸

平时看电视剧不多,国产剧就更少了,最大的一个感受就是有些演技真的是太尬了,一集电视剧四五十分钟,快进三十分钟?这部剧从小演员到专业演员,没有所谓的流量,至少所有人演技都在线,这也是我能坚持追剧的保障。

如果说演技是追剧的保障,那细节就应该是二刷的引子,追过剧之后我姐还在和我说一些小细节,比如录音笔的彩蛋呀、笛卡尔的梗呀,看剧时可能会感叹演技真不错,但值得回味的还是剧中的细节、伏笔,也是这些可能会吸引你去二刷。

每天靠微博热搜续命的我发现从这部剧上映到结局就没有下过热搜,这篇文章就通过Python可视化分析一下每天登上热搜的关键词,问题是微博只有实时热搜的榜单,而我们想获取的是这一段时间内的,万能百度后发现一个"热搜神器"满足需求,但缺点每条热搜可爬取的相关信息有些少。

审查之后发现网页有几个特征:

  • 每个网页的网址不发生改变
  • 网页内容以json形式存储
  • 网页的请求方式为POST
  • Form表单中,只有一个date发生改变

分析之后很容易得出,网站是通过控制Form表单中date的内容进而控制每天的热搜内容,那么爬虫的方式就很明确了,requests+json就足以应对,爬虫比较简单,就贴出一小部分代码,完整代码文末给出获取方式。

html = requests.post(url=url,headers=headers,data=form_data)
content = html.content.decode("utf-8")
datas = json.loads(content)

因为我们本意是只分析与《隐秘的角落》相关的热搜关键词,所以Duck不必保留所有的爬取内容,可以通过一些特有的关键词过滤,比如这部剧的名字、人物、热词,典型代表就是爬山梗。

我设定的时间区间为6.19-6.26共8天,最后爬取到与这部剧有关的热搜有87条:

通过观察爬取得到的数据会发现里面有一些重复的内容,但具体原因不明,这里对数据进行去重:

data.drop_duplicates(subset=None,keep='first',inplace=True)
data = data.reset_index(drop=True)

难免也会有些无关内容,样本数也不是很多,所以我们主观上确认一下热搜关键词,然后将无关内容删去即可,经过处理最后数据集剩下64条数据,也就是平均每天八条热搜。

搜索量Top10

先来看看这几天热度最高的10条热搜:

热度最高的是爬山梗,不知道会不会有景区用这个梗上一波热度!前十中秦昊自己就占了四个词条,再加上伊能静上"姐姐",快成热搜特邀嘉宾了。在这之前秦昊主演的悬疑剧《无证之罪》也引起了一波热度,编剧正是本剧原著作者紫金陈,拍手叫好。

热搜次数趋势

看一下这段时间热搜数量的趋势是怎样的:

在剧播出之初反响并不是很大,毕竟什么剧前期不论好坏,制作方都会先买一波热度,但到了中后期热搜词条的数量是越来越多的,在25号结局的前一天迎来高峰期,一天就有19条热搜。

pyecharts绘制曲线图时可以通过Line中的下面这个参数来设定阴影区间:

line.set_series_opts(markarea_opts=opts.MarkAreaOpts(data=[opts.MarkAreaItem(name="高峰期", x=("2020-06-24","2020-06-26"))])

热度趋势

与热搜次数相匹配的热度如何?

每天的热度与热搜次数很符合正相关,热搜次数越多热度也会越高,25号整天的热搜点击量共有2400多万,结局当天的点击量也有2100多万,热度也不小。

我们都知道如果一个热搜词条点击量越高排名就越靠前,排名越靠前会影响点击量越来越高,所以如果热搜次数和点击量能有着正相关的关系,那么可以推出这些热搜大部分的排名都比较高。

排名区间占比

用饼图的比例显示来验证一下上面的推论:

历史最高排名达到前十的占比就有62%,前二十就已经达到了84%,所以与这部剧相关的热搜词条绝大部分的排名都是比较靠前的,这也正是热度高的一个很重要的原因。

关键词词频统计

前面我们通过关键词来过滤相关词条,那么有哪些关键词搜索次数较高呢?

剧名的搜索次数为26次,占比最多,大约有四成,这应该是理所当然的,毕竟剧比演员火才能体现出一部剧是真的不错,人比剧火就显着比较尴尬啦,人物"朱朝阳"的搜索次数9次,我对这个人物设定真的是惊了,感觉其他人对朱朝阳来说就和陪玩一样,不亏是考年级第一的孩子,都说原著的人物比剧里的还叼,不敢想象。

词云图

最后贴一幅权重词云图:

可以看到出现次数较多的关键词占权重也会比较大,比较突出的就是剧名、人物、演员还有小白船,记得小学六一儿童节的时候总会有班级表演这个歌舞的,看完这个剧真的全毁了,而且总是不自觉就会哼出来。

都说《隐秘的角落》是中国电视剧的曙光,但怕的就是模子已经给出来了,照着画也是件难事,如果中国影视业不改掉"演员>导演>编剧"这样的关系链真的很难翻身,毕竟就艺术而言,还是编剧更贴切一些,至少这部剧是值得一看的,安利一下还没看过的伙伴,个人觉得节奏偏慢,习惯快节奏的伙伴需要耐心些。

公众号【喵说Python】后台回复"Kids"可获取源码和数据供参考

Python数据分析——《隐秘的角落》开播之后就没下过热搜?相关推荐

  1. python弹幕代码_使用python对隐秘的角落进行弹幕分析

    本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 最近有部很火的悬疑推理剧:<隐秘的角落>,豆瓣评分9.0,周末闲来无 ...

  2. 《Python数据分析与挖掘实战》第12章(下)——协同推荐

    本文是基于<Python数据分析与挖掘实战>的实战部分的第12章的数据--<电子商务网站用户行为分析及服务推荐>做的分析. 由于此章内容很多,因此,分为三个部分进行分享--数据 ...

  3. Python 数据分析微专业课程--项目05 多场景下的图表可视化表达

    1.项目说明 分析2016年奥运运动员数据,使用多种图表方式对多个指标进行可视化展示并进行分析 2.项目具体要求 1.分男女分别分析运动员的身高分布,并制作图表,数据为"奥运运动员数据.xl ...

  4. Python 爬取 201865 条《隐秘的角落》弹幕,发现看剧不如爬山?

    作者 | 朱小五 责编 | 屠敏 封图 | CSDN 付费下载自东方 IC 最近又火了一部国产剧:<隐秘的角落>. 如果你没看过,那可能会对朋友圈里大家说的"一起去爬山" ...

  5. python电视剧口碑分析_Python分析最近大火的网剧《隐秘的角落》

    前言 估计最近很火的连续剧<隐秘的角落>大家趁着端午假期都看过了吧?小编也跟着潮流,一口气把12集的连续剧全部看完了.看过的人肯定对朋友圈里有人发的"一起去爬山".&q ...

  6. python 数据分析 电信_基于Python的电信客户流失分析和预测

    一.项目背景 电信服务是生活中常见的消费服务,在现代社会,凡是使用手机打电话,或者在家看电视,都必须通过电信运营商提供的通话.网络等服务才能实现.本文采用来自kaggle平台的电信客户数据集,来分析人 ...

  7. Python数据分析之武林秘籍

    作者:chen_h 微信号 & QQ:862251340 微信公众号:coderpai 十八般武艺,大家各取所需.米哥简单整理了一下跟Python数据分析相关的技术呈现出来,台灯下,地铁里,各 ...

  8. 讲python讲得好的评价_分析20万条弹幕告诉你,8.9分的高分剧《隐秘的角落》到底好看在哪儿?...

    CDA数据分析师 出品作者:Mika 数据:真达 后期:泽龙 Show me data,用数据说话 今天我们聊一聊 <隐秘的角落> 点击下方视频,先睹为快: 最近这部<隐秘的角落&g ...

  9. 《隐秘的角落》影评数据分析

    一.研究背景 随着移动互联网和智能设备的不断发展,人们的生活质量也不断地提高,可以通过互联网在线对电视剧进行评价评分.电视剧的热播不但给电视剧市场带来巨大的经济利益,同时也给电视剧主演们带来巨大的名气 ...

最新文章

  1. java mvc数据库 封装_Springmvc对就jdbc封装的操作
  2. mysql page header_MySQL系列:innodb源码分析之page结构解析
  3. 以太网的MAC帧(二)
  4. HDFS设计思路,HDFS使用,查看集群状态,HDFS,HDFS上传文件,HDFS下载文件,yarn web管理界面信息查看,运行一个mapreduce程序,mapreduce的demo
  5. yii2组件之下拉框带搜索功能(yii-select2)
  6. PO_本地一揽子采购协议(流程)
  7. 习题3.11 表达式转换 (25分)
  8. Linux系统调用表(x86_64)
  9. 乌班图系统修改服务器时间的命令,ubuntu 修改系统时间无效
  10. AC日记——可能的路径 51nod 1247
  11. L1-043. 阅览室
  12. 自定义注解-用spel表达式 获取方法入参对象的的 get方法入参
  13. WINDOWS图片和传真查看器找不到
  14. Python的MRO
  15. 计算机文件夹加密码怎么设置,如何为文件夹设置密码,教您如何设置
  16. [置顶] 一个程序员的科幻小说
  17. python excel筛选统计_懂点EXCEL就行!教你利用Python做数据筛选(上)
  18. 哈佛机构与冯诺依曼架构
  19. MySQL原理 - 字符集与排序规则
  20. 媒体-PR-微商-地摊儿…… 媒体人的转型你到了哪一步?

热门文章

  1. 行人再识别(行人重识别)【包含与行人检测的对比】
  2. 使用el upload标签上传文件的几种常见使用场景(前台+后台)
  3. 阿里的Hadoop之路:Hadoop的过去、现在和未来
  4. 会声会影2018、2019版启动提示未注册的解决方法
  5. 点击化学 DBCO-Benzaldehyde,DBCO-苯甲醛,二苯并环辛炔-苯甲醛
  6. AI技术赋能数智化转型,激发企业变革创新
  7. phpBB安装环境配置
  8. 苹果台式机_韩媒曝苹果台式机将首次采用京东方LCD
  9. php日期源码,php学习笔记之日期时间函数-PHP源码
  10. 控制元素聚焦_聚焦资产商店角色控制器