不知道大家最近有没有去看电影,最近身边的朋友都在向我安利一部叫做《哪吒之魔童降世》的动漫电影。大家无一例外,都说非常的好看。

看一下最近的微信搜索指数,比火热的电视剧“亲爱的热爱的”搜索指数要高出近6倍,比迪斯尼的“狮子王”要高出22倍,确实非常火。

小编抱着好奇的心态,去猫眼上看了一下,结果显示在接近84万人评分的情况下,评分竟然高达9.7分。看了这确实是一部好剧,也值得我去爬取一下大家的评论,并进行一波分析,从中发现一些值得关注的东西。

1 数据的获取

首先是关于数据的爬取,数据的爬取相对简单,大家只需要打开猫眼网里面这部片子的网址,便可以看到下面的影评。在开发者模式中,切换到移动端,便可以看到影评,如果大家仔细观察,可以发现,影评是动态加载的,如下图所示:

动态加载的话,大家只需要在network下的XHR内,仔细观察,便可以发现网页动态加载的json数据,也就是我们要爬取的数据。如下图所示。

(动态图)

接下来就是利用简单的爬虫进行爬取了,部分代码如下图所示。

爬取的过程其实很简单,通过手机端的链接进去,然后循环爬取,用bs进行解析即可,然后把保存为json文件。

2 数据的分析

爬取完数据之后,接下来便是数据的分析,上述的数据中,大概有5000多条。(先爬5000条,高并发几十万条需要用分布式爬虫才可以)

小编爬到了评论者的性别(0为未知,1代表男,2代表女)、等级、所在城市、评分以及评语。

3 影评分析

用Python做可视化分析的工具很多,目前比较轻量级好用的库是pyecharts,在公众号里面多次讲解过它的用法,这里就不详细重复了!我们看快速看一下近5000条影评的数据可视化结果:

1)总体评分

《哪吒》在猫眼中的总体评分为9.7分,这个分数无疑是非常高的。超过了国产动画 比如“白蛇传”。从评分分布来看,大多数评分都给了满分,占总数的86.5%,其次是4.5分,占总数的7.7%,给到3分及以下的人非常少,还不足总人数的5%,要知道众口难调,这个差评比例在电影中可以算非常低的了。

2)性别差异

通常来说这种国产动画的“大片”比较符合大众口味,从评论者性别分布数据来看,虽然有接近一半的人不愿透露性别,但从已知数据判断,观影男女比例约为1:1多一点,女性观众的比例稍微高一点。

3).城市分布

接下来小编分析了评论者所在的城市分布。首先是直方图的来粗略的展示前十大热门的影迷城市,如下图所示:

直方图的展示不是很直观也不全面,因此,小编采用地图的形式,为大家更加直观的进行展示,由于观影者的城市地理位置可能没有出现在程序的设置中,因此,小编只选取了观影城市最多的前八十个城市作为动态展示,如下图所示:

(动态图)

4).评论内容

首先整合评论内容,然后利用wordcloud库绘制词云图,从词云分析情况来看,满屏的“好看”,“不错”,“特效”等赞美的词语,与以往的电影不同的是,“剧情”,“故事”等字眼也特别醒目。

其实这部大片,算是国产动画电影里面的大制作,电影制作花了5年的时间,剧本改了60几个版本,制作的团队高达千人。电影里面有1800多个镜头,有1300多个是特效,这样的用心之作难怪上映之后,口碑爆棚啊!

而且导演还有很多致敬 星爷的地方,比如太乙真人那段,很像功夫片段里面的桥段,最搞笑的还有一本《神仙的自我修养》,好了不剧透了,大家赶紧去电影院看一下吧。

往期热门:

菜鸟学Python数据分析|文章汇总上篇

值得收藏|菜鸟学Python【入门文章大全】

菜鸟写Python程序,如何从新手变老手

学习群:

小密圈人气很高的两个实战项目

小密圈的趣味实战-微信主题

3个月还没入门Python,看这100名小密圈的同学3周学Python的杰作

游戏类:

下载量20000人的,用Python写个弹球游戏2.0

巧妙的Python数据结构玩法|实战德州扑克

5天破10亿的哪吒,为啥这么火,Python来分析相关推荐

  1. 用Python来分析5天破10亿的哪吒,为啥这么火?

    点击上方"视学算法",选择右上角"置顶公众号" 不知道大家最近有没有去看电影,最近身边的朋友都在向我安利一部叫做<哪吒之魔童降世>的动漫电影.大家无 ...

  2. 数据分析——5天破10亿的哪吒,为啥这么火,Python来分析

    不知道大家最近有没有去看电影,最近身边的朋友都在向我安利一部叫做<哪吒之魔童降世>的动漫电影.大家无一例外,都说非常的好看. 看一下最近的微信搜索指数,比火热的电视剧"亲爱的热爱 ...

  3. 5天破10亿的哪吒,为啥这么火,Python来分析!

    Python资源共享群:484031800 不知道大家最近有没有去看电影,最近身边的朋友都在向我安利一部叫做<哪吒之魔童降世>的动漫电影.大家无一例外,都说非常的好看. 看一下最近的微信搜 ...

  4. 5天破10亿的哪吒,为啥这么火,Python来分析 !

    Python资源共享群:484031800 不知道大家最近有没有去看电影,最近身边的朋友都在向我安利一部叫做<哪吒之魔童降世>的动漫电影.大家无一例外,都说非常的好看. 看一下最近的微信搜 ...

  5. 厉害了!《流浪地球》《疯狂的外星人》票房均破10亿元大关

    [TechWeb]2月8日消息,据中国票房网实时数据显示,目前<流浪地球><疯狂的外星人>电影票房均破10亿元,排名第三的<飞驰人生>录得7.49亿元票房. 数据来 ...

  6. 去年双11破10亿的耐克,和我们分享了2018新零售计划 | 新网商营销大会

    "去年双11,耐克天猫旗舰店的销售额突破了10亿元,这是耐克和天猫共同创造的一个里程碑纪录." 4月26日,耐克大中华区Nike Direct副总裁范欧盛(Dennis Van O ...

  7. 全球月活用户4年破10亿,TikTok的3大底层逻辑

    武汉瑞卡迪电子商务有限公司:在即将过去的2022年,TikTok成为了众多出海品牌想要赢得新生意的重要平台.品牌应该如何看待TikTok?如何利用节点营销抓住机会?那些已经在TikTok上成功的品牌背 ...

  8. 国庆档电影《我和我的祖国》3天票房破10亿

    [TechWeb]10月3日,阿里影业灯塔专业版数据显示,截至10月2日19点,电影<我和我的祖国>总票房正式突破10亿大关,这也是2019年第7部超过10亿的国产影片. <我和我的 ...

  9. 破10亿用户的支付宝给支付生态的启示

    1月9日消息,支付宝正式对外宣布,支付宝全球用户数已经超过10亿.此前,11月28日,支付宝宣布全球用户数已经超过9亿,其中,在国内的活跃用户中,70%的用户使用3项及以上支付宝的服务.支付宝方面表示 ...

最新文章

  1. Android样式和主题(二):系统有哪些主题
  2. WINDOWS系统文件讲解
  3. Hibernate 拦截器实例
  4. swift string转int_swift中结构体和类的区别(值类型和引用类型的区别)
  5. MSE和Cross-entropy梯度更新比较
  6. html制作状态栏数字时钟,html5 canvas制作15种数字时钟样式代码
  7. 第 91 章 SMS
  8. nginx php重定向,nginx如何重定向信息
  9. redis 加载mysql_Mysql Redis PostgreSQL数据库查看客户端连接
  10. 4am永远 鼠标按键设置_适合我的精英手柄,机械按键与体感最爱:北通宙斯T6体验...
  11. 鼠标右键转圈圈_鼠标点击右键后一直转圈圈
  12. 看我骚操作‘破解’某查查app的sign以及某眼查的Authorization!
  13. 联盛德W806入门教程-CDK安装教程及代码下烧录
  14. 服务通知——小程序消息推送、模板消息推送demo
  15. 【辅助工具】20款优秀的移动产品原型和线框图设计工具
  16. linux var mqm权限,Linux MQ中间件/var/mqm文件系统结构与错误日志分析
  17. zb怎么做渲染图_zbrush精加工和渲染
  18. MySQLSyntaxErrorException: In aggregated query without GROUP BY聚合查询语法异常
  19. 2022年[最新]泰晤士高等教育世界大学声誉排名(完整版)
  20. 基于MOS管的负载开关电路

热门文章

  1. 制造业企业如何高效进行生产计划排单?
  2. 关于Tekla的API
  3. tekla二次开发用C语言,Tekla能够进行哪些二次开发?Tekla二次开发功能详解
  4. debian10RAID5和磁盘加密
  5. easyrecovery15版本专业数据恢复软件
  6. 《循序渐进DB2(第2版)——DBA系统管理、运维与应用案例》书评之“搜千遍,找万遍,不如手持一本万能剑”...
  7. pythoncqt_Librosa常数Q变换(CQT)在谱图的开始和结束处都存在缺陷
  8. 逻辑调试器link-logic
  9. 【已解决】PS自动退出并显示“在退出之前存储对Adobe Photoshop文档的更改吗?”
  10. 【国产虚拟仪器】基于DSP+FPGA+ADS1282支持32Bit高精度数据采集方案(三)系统性能测试