豆瓣Top250电影数据分析报告

我的其他数据分析报告：求职指南——数据分析职位解析
【Python3】Requests+正则表达式+multiprocessing爬虫并存入MySQL数据库

一、分析背景及目的

豆瓣对Top250电影的定义：
豆瓣用户每天都在对“看过”的电影进行“很差”到“力荐”的评价，豆瓣根据每部影片看过的人数以及该影片所得的评价等综合数据，通过算法分析产生豆瓣电影 Top 250。

本报告旨在对这250部电影（下称“好评电影”）的上映年代、电影导演、制作国家、电影类型进行分析，以期为 电影制作方 以及 渴望寻找优秀电影观看的观影者 对电影的选择提供若干参考建议。

二、数据可视化分析

1、上映年代分析

好评电影多集中在1990年之后。在1990年之前以及1990年之后两部分中，好评电影数量波动不大。电影艺术会随着时代的变化而变化，如今的观影者会更加接受现代的电影艺术。

进入21世纪之后，好评电影数量较多。好评电影出现最多的年代处于2000~2009年之间。

2、导演情况分析

在好评电影中，有多位导演的不止一部影片上榜，其中上榜电影数最多的两位导演是：克里斯托弗·诺兰和宫崎骏。在其后也有多位中国籍导演。导演对于一部影片的影响巨大，可以说好的导演能决定一部电影的成功与否。

3、制作国家分析

好评电影的制作国家由美国领衔，占比近50%。在其后日本、香港、中国大陆、英国也占了较大份额。美国的电影产业较为成熟，引领着这个时代的电影艺术潮流。

4、电影类型分析

在好评电影中，剧情类型电影一骑绝尘，有高达186部电影带有“剧情”标签。其后，爱情、喜剧、冒险等类型也有多部电影。电影类型决定了电影的基调和主旨，是决定电影内容的重要因素之一。

将上述分析元素做成词云可以直观的看出来词条出现的频率：

三、结论与建议

根据此前对豆瓣Top250影片的数据分析，本报告对电影制作方以及迷茫的观影者几点建议：
1、电影艺术是随着时代而转变的，大部分观影者更加接受于此时相近年代的电影，21世纪第一个十年内的电影是好评最多的时期。电影制作方可以选择10年前到20年前区间内的影片重制推出，用口碑吸引观影者。观影者也可以选择这期间的电影在休息时观看。
2、导演是一部影片好坏的关键因素之一，一个好的导演可以成就一部电影。电影制作方在选择导演时可以选择榜上作品多的导演。观影者可以选择克里斯托弗·诺兰和宫崎骏两位导演的影片观看。
3、好的电影一般出自好的电影氛围，制作国家可以对影片造成影响。好评电影中，美国电影占到近一半。电影制作方或可借鉴学习美国电影的流行趋势，观影者可以选择美国电影来观看。
4、电影类型是观影者选择是否观看此影片的重要因素之一。“剧情”、“爱情”、“喜剧”是受众主流，电影制作方可以将其作为口碑的保守选择，观影者可以选择这些类型观看。