数据分析之《我不是药神》
前言
作为暑期最受欢迎的电影之一,《我不是药神》在上映之前就被刷屏,它不仅是豆瓣16年来第9部评分超过9.0的华语影片,也是第5部票房超过20亿的影片。记得小编当时还在学校未放假时,药神就在朋友圈被好友频频安利,于是一放假就迫不及待的去看了。看完给我的感觉就是中国这样的电影真的太少了,毫无疑问,它的成功是必然的。于是在其上映一个月后,小编想看看全国网友对药神的评价究竟如何,就做了关于药神的影评分析。
数据抓取
此次数据爬取我们参考了之前其他文章中对于猫眼数据的爬取方法,调用其接口,每次取出1000页的数据并进行去重,为了使最终的数据可靠性更高,小编抓取了多次当日的数据,代码如下:
数据分析
我们先来看下所得到的数据
这个数据是小编去重后所得的,并且按照了城市进行排序,后面的部分主要围绕评分、城市、评论展开。
首先看一下评分热力图
京津翼、江浙沪、珠三角等在各种榜单长期霸榜单的区域,在热力图中,依然占据着重要地位。同时,我们看到东三省和四川、重庆所在区域也有着十分高的热度,这表明药神的热度即使到现在也还是特别高的。
下面我们要看的是主要城市的评论数量与打分情况
打出最高分4.86的城市是无锡市,而最低分4.46是东莞市,而徐峥的家乡上海打分在4.6左右。综合各个城市的打分来看药神的评分还是比较高的。
我们按照打分从高到底对城市进行排序
在评论数量最多的二十个城市中,评论数量最高的是深圳,北京,其次是成都。而后15名的评论数量和评分都差不多。说明药神的口碑没有出现两极分化的现象。这也跟药神一直以来的评价所对应。
我们把城市打分情况投射到地图中:(红色表示打分较高,蓝色表示较低)
可以看出南北方对这部电影的评价都很高。这也是药神的票房之高的原因。
看过了评分,我们看一下评论生成的词云图,以下分别是原图和据此绘制的词云图
从生成的词云中可看出网友对药神的评价最多的是好看,现实,感人,真实,良心。这与小编在朋友圈中看好友所发的对药神的评价都是一致的。正如战狼2一样,把钱花在制作上,用心拍摄的良心大作,相信还是会有回报,国产电影是可以兼顾社会责任和商业利润的!用心做电影,时代不会辜负你,观众不会辜负你!正如一些网友评论所说,这是中国电影人的良知觉醒,应该多些现实题材的呼吁,反映民众的心声,告诉政府和社会我们需要做什么。
部分代码展示
热力图
折线图+柱形图组合
词云
本篇代码:
github.com/NGUWQ/yaosh…
此文思路来源于:数据森麟 “3天破9亿!上万条评论解读《西虹市首富》是否值得一看” 一文。
对爬虫,数据分析,算法感兴趣的朋友们,可以加微信公众号 TWcoding,我们一起玩转Python。
If it works for you.Please,star.
自助者,天助之
转载于:https://juejin.im/post/5b6fadb451882560fc512e68
数据分析之《我不是药神》相关推荐
- 这里有个自学数据分析并拿到大厂offer的文科小姐姐
今天跟大家推荐一个自学数据分析的文科妹子[糖甜甜甜],本科就读于重庆双非市场营销专业,后保研至某985大学,自学数据分析相关内容,研究生期间先后在亚马逊.阿里实习做数据分析师工作.个人公众号为:「Da ...
- 关于药神、复联3和超时空同居的人生,你怎么看?
看过<我不是药神>,确实很感动,相信大家朋友圈都充斥着各种大神们和专家们从分析国家医药政策,经济方案,甚至制药技术的各类文章. 这两天虽然热度有所下降,但全民讨论现象似乎还在继续. 我也来 ...
- 数据可视化-豆瓣影评数据分析(FineBI)
目录 一.实验(实训)目的 二.实验(实训)原理或方法 三.仪器设备.材料 四.实验(实训)步骤 五.实训记录及结果 <------------------------------------- ...
- 《我不是药神》30亿票房后分析徐峥的选角眼光
作者简介 糖甜甜甜,R语言中文社区专栏作者 公众号:经管人学数据分析 01 前言 前段时间向往的生活第二季中,托尼何老师给山争大叔洗头那一幕,着实给节目赚足了笑点. 而最近徐峥凭借<我不是药神 ...
- 程序员用Python分析徐峥,竟研究出《我不是药神》30亿票房真正秘诀!
前言 前段时间向往的生活第二季中,托尼何老师给山争大叔洗头那一幕,着实给节目赚足了笑点. 而最近徐峥凭借<我不是药神>在电影院也收了不少观众眼泪,在这部电影里面他颠覆了当初囧系IP电影和心 ...
- 数据分析案例:谁是2018当之无愧的“第一”国产电影
海选:票房才是话语权 酒香也怕巷子深,虽然票房不是衡量影片好坏的唯一标准,但是票房一定程度反映了包括你我在内的广大群众对该影片的偏好.这里,我们简单粗暴地挑选2018年三部年度总票房突破"3 ...
- ActiveReports 大数据分析报告:2018中国电影再次迎来黄金时代
回顾2018,中国电影市场收获颇丰.先是凭借春节档<红海行动>.<唐人街探案>双双实现30亿票房突破,而后暑期档火力全开,<我不是药神>.<西虹市首富> ...
- 爬虫+数据分析+可视化大作业:基于大数据的高质量电影分析报告
主要目的是为了学习Scrapy与Sklearn而不是写论文,结论是瞎扯的,轻喷求求了 目录 摘要 数据爬虫程序设计和实现 Scrapy框架 Scrapy框架简介 Scrapy的组件 Scrapy的工作 ...
- 用Python来看3天破10亿的《我不是药神》到底神在哪?
文章转载自公众号:51CTO技术栈(ID:blog51cto) 作者:刘晓明 简介:互联网公司运维技术负责人,拥有 10 年的互联网开发和运维经验.一直致力于运维工具的开发和运维专家服务的推进,赋能开 ...
最新文章
- LiFi会将大数据和物联网带到新高度吗?
- Java如何拆分字符串
- 复杂的结构化存取(一)
- WARN ServletController:171 - Can't find the the request for xxxx's Observer
- 《×××颂》贵在突破了中国花鸟画难以反映社会主题的尴尬
- c语言最大公约数和最小公倍数_五年级数学最大公因数最小公倍数 练习
- 在Windows下搭建SVN服务器并且集成到 Eclipse 开发环境中
- 【人体姿态估计2】Real-time Multi-person 2d pose estimation using part affinity fields_2017
- jzoj1264,P2866-乱头发节,糟糕的一天Bad Hair Day【单调栈】
- css那些事儿4 背景图像
- JVM 学习二:类加载器子系统
- java环境变量配置 - win10
- 获取ASP.NET MVC中的完整操作URL [重复]
- pythonexcel模块哪个好_Python-Excel 模块哪家强?
- Intel处理器系列
- 《简明python教程》_简明Python教程
- Layui实现Eharts图表
- E680手机上能用的 MPlayer
- 固态硬盘颗粒有哪些?固态硬盘SLC、MLC、TLC、QLC有什么不同?
- solver参数详解