前言

作为暑期最受欢迎的电影之一,《我不是药神》在上映之前就被刷屏,它不仅是豆瓣16年来第9部评分超过9.0的华语影片,也是第5部票房超过20亿的影片。记得小编当时还在学校未放假时,药神就在朋友圈被好友频频安利,于是一放假就迫不及待的去看了。看完给我的感觉就是中国这样的电影真的太少了,毫无疑问,它的成功是必然的。于是在其上映一个月后,小编想看看全国网友对药神的评价究竟如何,就做了关于药神的影评分析。

数据抓取

此次数据爬取我们参考了之前其他文章中对于猫眼数据的爬取方法,调用其接口,每次取出1000页的数据并进行去重,为了使最终的数据可靠性更高,小编抓取了多次当日的数据,代码如下:

数据分析

我们先来看下所得到的数据

这个数据是小编去重后所得的,并且按照了城市进行排序,后面的部分主要围绕评分、城市、评论展开。

首先看一下评分热力图

京津翼、江浙沪、珠三角等在各种榜单长期霸榜单的区域,在热力图中,依然占据着重要地位。同时,我们看到东三省和四川、重庆所在区域也有着十分高的热度,这表明药神的热度即使到现在也还是特别高的。

下面我们要看的是主要城市的评论数量与打分情况

打出最高分4.86的城市是无锡市,而最低分4.46是东莞市,而徐峥的家乡上海打分在4.6左右。综合各个城市的打分来看药神的评分还是比较高的。

我们按照打分从高到底对城市进行排序

在评论数量最多的二十个城市中,评论数量最高的是深圳,北京,其次是成都。而后15名的评论数量和评分都差不多。说明药神的口碑没有出现两极分化的现象。这也跟药神一直以来的评价所对应。

我们把城市打分情况投射到地图中:(红色表示打分较高,蓝色表示较低)

可以看出南北方对这部电影的评价都很高。这也是药神的票房之高的原因。

看过了评分,我们看一下评论生成的词云图,以下分别是原图和据此绘制的词云图

从生成的词云中可看出网友对药神的评价最多的是好看,现实,感人,真实,良心。这与小编在朋友圈中看好友所发的对药神的评价都是一致的。正如战狼2一样,把钱花在制作上,用心拍摄的良心大作,相信还是会有回报,国产电影是可以兼顾社会责任和商业利润的!用心做电影,时代不会辜负你,观众不会辜负你!正如一些网友评论所说,这是中国电影人的良知觉醒,应该多些现实题材的呼吁,反映民众的心声,告诉政府和社会我们需要做什么。

部分代码展示

热力图

折线图+柱形图组合

词云

本篇代码:

github.com/NGUWQ/yaosh…

此文思路来源于:数据森麟 “3天破9亿!上万条评论解读《西虹市首富》是否值得一看” 一文。

对爬虫,数据分析,算法感兴趣的朋友们,可以加微信公众号 TWcoding,我们一起玩转Python。

If it works for you.Please,star.

自助者,天助之

转载于:https://juejin.im/post/5b6fadb451882560fc512e68

数据分析之《我不是药神》相关推荐

  1. 这里有个自学数据分析并拿到大厂offer的文科小姐姐

    今天跟大家推荐一个自学数据分析的文科妹子[糖甜甜甜],本科就读于重庆双非市场营销专业,后保研至某985大学,自学数据分析相关内容,研究生期间先后在亚马逊.阿里实习做数据分析师工作.个人公众号为:「Da ...

  2. 关于药神、复联3和超时空同居的人生,你怎么看?

    看过<我不是药神>,确实很感动,相信大家朋友圈都充斥着各种大神们和专家们从分析国家医药政策,经济方案,甚至制药技术的各类文章. 这两天虽然热度有所下降,但全民讨论现象似乎还在继续. 我也来 ...

  3. 数据可视化-豆瓣影评数据分析(FineBI)

    目录 一.实验(实训)目的 二.实验(实训)原理或方法 三.仪器设备.材料 四.实验(实训)步骤 五.实训记录及结果 <------------------------------------- ...

  4. 《我不是药神》30亿票房后分析徐峥的选角眼光

    作者简介 糖甜甜甜,R语言中文社区专栏作者 公众号:经管人学数据分析 01  前言 前段时间向往的生活第二季中,托尼何老师给山争大叔洗头那一幕,着实给节目赚足了笑点. 而最近徐峥凭借<我不是药神 ...

  5. 程序员用Python分析徐峥,竟研究出《我不是药神》30亿票房真正秘诀!

    前言 前段时间向往的生活第二季中,托尼何老师给山争大叔洗头那一幕,着实给节目赚足了笑点. 而最近徐峥凭借<我不是药神>在电影院也收了不少观众眼泪,在这部电影里面他颠覆了当初囧系IP电影和心 ...

  6. 数据分析案例:谁是2018当之无愧的“第一”国产电影

    海选:票房才是话语权 酒香也怕巷子深,虽然票房不是衡量影片好坏的唯一标准,但是票房一定程度反映了包括你我在内的广大群众对该影片的偏好.这里,我们简单粗暴地挑选2018年三部年度总票房突破"3 ...

  7. ActiveReports 大数据分析报告:2018中国电影再次迎来黄金时代

    回顾2018,中国电影市场收获颇丰.先是凭借春节档<红海行动>.<唐人街探案>双双实现30亿票房突破,而后暑期档火力全开,<我不是药神>.<西虹市首富> ...

  8. 爬虫+数据分析+可视化大作业:基于大数据的高质量电影分析报告

    主要目的是为了学习Scrapy与Sklearn而不是写论文,结论是瞎扯的,轻喷求求了 目录 摘要 数据爬虫程序设计和实现 Scrapy框架 Scrapy框架简介 Scrapy的组件 Scrapy的工作 ...

  9. 用Python来看3天破10亿的《我不是药神》到底神在哪?

    文章转载自公众号:51CTO技术栈(ID:blog51cto) 作者:刘晓明 简介:互联网公司运维技术负责人,拥有 10 年的互联网开发和运维经验.一直致力于运维工具的开发和运维专家服务的推进,赋能开 ...

最新文章

  1. LiFi会将大数据和物联网带到新高度吗?
  2. Java如何拆分字符串
  3. 复杂的结构化存取(一)
  4. WARN ServletController:171 - Can't find the the request for xxxx's Observer
  5. 《×××颂》贵在突破了中国花鸟画难以反映社会主题的尴尬
  6. c语言最大公约数和最小公倍数_五年级数学最大公因数最小公倍数 练习
  7. 在Windows下搭建SVN服务器并且集成到 Eclipse 开发环境中
  8. 【人体姿态估计2】Real-time Multi-person 2d pose estimation using part affinity fields_2017
  9. jzoj1264,P2866-乱头发节,糟糕的一天Bad Hair Day【单调栈】
  10. css那些事儿4 背景图像
  11. JVM 学习二:类加载器子系统
  12. java环境变量配置 - win10
  13. 获取ASP.NET MVC中的完整操作URL [重复]
  14. pythonexcel模块哪个好_Python-Excel 模块哪家强?
  15. Intel处理器系列
  16. 《简明python教程》_简明Python教程
  17. Layui实现Eharts图表
  18. E680手机上能用的 MPlayer
  19. 固态硬盘颗粒有哪些?固态硬盘SLC、MLC、TLC、QLC有什么不同?
  20. solver参数详解

热门文章

  1. Java毕设答辩会问些什么?
  2. 双模控制器很耗电_电动车双电双核控制系统是在说什么?这个部件的发展一日千里!...
  3. MarkDown高阶语法手册
  4. 求解矩阵Ax=b最小二乘问题
  5. 脉冲发生器c语言程序,可编程脉冲信号发生器的.doc
  6. Maven下载及安装教程详解
  7. 如何解释“运维到底是干啥的”?
  8. ios 闪退的原因及解决方案
  9. 北京理工大学 计算机考研真题,北京理工大学考研真题汇总
  10. Java实现仿QQ聊天工具的项目总结