如今文学作品被翻拍成电影,搬上大银幕已经成为一种风潮。与此同时,原著和电影之间的比较也成为了大家经常谈论的话题。那么,如何客观评价原著和翻拍电影之间谁更好呢?本篇可视化作品的作者 Brittany Fong 就搜罗了大量评分数据,并利用数据可视化工具,从多角度、多维度深入探索,很直观的为我们展示了原著和电影谁更受观众的喜爱!

首先,要想将原著和电影两者进行客观公正的比较,作者找到了两个网站,并以它们的评分作为数据支撑。这两个网站分别为图书评分网站 Goodreads.com(评分等级为1 - 5)和电影评分网站 IMDB.com(评分等级为 1 - 10)。原始数据有了,下面该考虑的就是如何将两个不同评分机制的数据结合为统一维度的参考数据,请往下看:

原著和电影的评分图鉴

作者以原著评分作为纵轴,电影评分作为横轴制作了一个象限图。将 230 部作品依据网站评分进行归位,最终形成了下图:

通过此散点图,除了可点击每个圆点查看每部作品原著及电影的具体评分外,我们还能够一目了然地看到作品整体的分布情况,例如右上方第一象限中,原著和电影评分均高于平均值,汇聚在此区域的都是很优秀的作品。像我们大家熟知的《教父》就凭借原著 4.36 分,电影 9.2 分的高分位于这一象限。

但是,能够取得《教父》这么高评分的毕竟是少数,为了不让这些少数的极端值影响到最终结论,作者利用象限分布图划分出了这些偏离值(偏离值是指在图中所有数据里与其他数值相比差异较大的一些数值)。即深蓝色圆点处被作者标注出来的《 戴帽子的猫 》、《 五十度灰 》等。这些数据会被适当的舍弃,以保证此次统计更具普遍性。

优秀的原著能否成就优秀的电影?

在 Goodreads.com 和 IMDB.com 两个网站的评分清单中,有 10 位作者拥有 4 本以上的书被拍成电影。于是,作者使用堆积条形图的方式,列出了作品数量排名前 8 位的作者以及他们的作品。

将鼠标悬停在不同颜色的方块上即可查看每部作品的名称,像我们熟知的史蒂芬·金的《 闪灵 》、J·K·罗琳的《 哈利·波特 》系列、简·奥斯汀的《 傲慢与偏见 》、查尔斯·狄更斯的《 雾都孤儿 》等。

基于象限图中的作品分布,作者还将其划分为了三个维度。即深蓝色为原著比电影好、蓝色为原著和电影一样好、紫色为电影比原著好。

再根据三个维度来看此堆积条形图,8 个作者的 49 个作品中,只有史蒂芬·金的《 闪灵 》、查尔斯·狄更斯的《 双城记 》、约翰·罗纳德·瑞尔·托尔金的《 指环王 1 : 魔戒再现 》三部作品被评为电影比原著好看。出现这种现象很可能是由于这些作者的高知名度和著作被广泛关注,让观众提高了期待值,从而在电影面世后产生心理落差,出现期望越高失望越大的情况。又可能是如名句说到的那样 “一千个读者有一千个哈姆雷特” ,经典名著的改编很难获得广大受众的一致好评。

《哈利·波特》原著和电影的表现如何

在本篇作品中,作者还聚焦分析了《 哈利·波特 》系列作品。《 哈利·波特 》系列丛书由J.K.罗琳于 1997 年至 2007 年创作。在世界范围内,《 哈利·波特 》丛书的销量超过了 5 亿本。《 哈利·波特 》系列电影同样大受欢迎,一路狂揽了几十亿的票房,其中的《 哈利·波特与死亡圣器 》,《 哈利·波特与魔法石 》两部更是入选英国十大最佳电影。《 哈利·波特 》系列作品确实不同凡响,那么,它在评分上的表现是否也是一如既往的优秀呢?

作者通过以下两幅图进行了验证。首先在散点图中,《 哈利·波特 》系列作品全部位于散点图右上方第一象限,这个位置表明了《 哈利·波特 》系列的原著和电影评分均高于平均水平,且成绩不俗,原著评分最高达到了 4.62 分的高分(满分 5 分),电影也拿到了 7.9 分的高分(满分 10 分)。

再看条形图,灰色条形图代表着每部作品的平均分,从条形图的长度我们就能一眼看出《 哈利·波特 》系列原著的评分高达 4.5 分,高于《 魔戒 》、《 纳尼亚传奇 》、《 侏罗纪公园 》等的平均分。电影评分上,《 哈利·波特 》系列虽然不是最出色的,也仍以 7.643 的分数排在了第三。综合看来,《 哈利·波特 》系列确实是一部原著和电影均口碑极佳,且领先于大多电影的评分。

哪个类型的电影更受欢迎?

最后,作者又从作品类型的角度出发,统计了不同作品类型之间原著和电影的评分。加入作品类型的数量这一数据后,呈现出了以下气泡图:

气泡图中,气泡的大小代表了数量的多少,将鼠标悬停在最大的剧情类气泡上,可查看到此类作品的数量有 233 个之多。由此我们发现剧情类是最多的一种被搬上电影屏幕的类型。再从评分方向看气泡图,传记类型在原著和电影上均得到最高评分,分别为 4.0967 分, 7.6 分。看来,真实生动的传记类作品不论在著作还是电影上都深受大众的好评。

为了具体表现不同作品类型的对比情况,作者又制作了条形图。下图中三列分别为不同类型的作品数量、原著评分和电影评分。大家只需查看条形的长短就能快速辨认出剧情类作品的数量遥遥领先于其他类型作品。虽然不同类型的作品数量相差很大,但从原著和电影的评分上看不同类型作品间并没有形成特别悬殊的差距。由此可知,可能有哪个类型作品更受大众欢迎之分,但没有哪个类型作品评分更高之分,毕竟这是要具体看每一部作品的表现的。

看过了不同类型作品数量上的比较,我们再将重点放在不同类型作品原著和电影评分的比较上。从作为评分显示的蓝色原点位置看,剧情类作品的评分差最大,以同为剧情类型的《 教父 》和《 房间 》电影评分为例,《 教父 》9.2 分,《 房间 》3.6 分评分相当悬殊。浪漫爱情类原著作品虽然以 112 部的数量排在第二,但此类型的原著和电影评分并不高,甚至低于数量只有 33 部的犯罪类评分。这也能看出,原著的数量多并不代表这类作品的评分就会高,一些类型的原著少而精,翻拍出的电影也是叫好又叫座。

从这篇 作品中我们可以感受到,原著与电影的评分是由多方面因素造成的,因此会出现不同的结果,有可能是高水平的原著被翻拍成了高评分的电影。也有可能原著并不出彩,电影却大放光彩。还会出现一部上等著作,拍出的电影却毫无闪光点。可见,完全地理清原著与电影间的比较关系并不是一件容易的事。感谢作者将不同数据融合分析,以多样的图表形式加以呈现,为我们带来了一部由浅入深,清晰易懂的可视化作品。如果你想传达、分享清楚某一现象,不如使用厦门艾科思移动报表平台制作一份可视化分析报告吧!

大数据分析:原著 PK 电影,谁更得观众心?相关推荐

  1. 基于Hadoop的豆瓣电影的数据抓取、数据清洗、大数据分析(hdfs、flume、hive、mysql等)、大屏可视化

    目录 项目介绍 研究背景 国内外研究现状分析 研究目的 研究意义 研究总体设计 数据获取 网络爬虫介绍 豆瓣电影数据的采集 数据预处理 数据导入及环境配置 Flume介绍 Hive介绍 MySQL介绍 ...

  2. 宠物app如何借助大数据分析提供更贴心的宠物养护

    宠物越来越成为了人们生活中不可或缺的一部分.越来越多的人开始养宠物,而宠物的养护也变得越来越重要.为了更好地照顾宠物,宠物app应运而生.但是,如何利用大数据分析来提供更贴心的宠物养护呢? 一.宠物健 ...

  3. 从固化报表到自助分析,企业如何构建一站式大数据分析平台?

    "数据没有分析是一种资源的浪费,分析没有数据是做无用功." 近年来,随着企业数据化建设进程加快,越来越多的企业逐渐从单一报表开发模式过渡到"报表+自助"双模式阶 ...

  4. 大数据分析有什么含义和作用

    大数据分析是指对规模巨大的数据进行分析,挖掘数据的有利信息并加以有效利用,将数据的深层价值体现出来.有了大数据分析才能让规模巨大的数据有条有理,正确分类,产生有价值的分析报告,从而应用到各领域中,促进 ...

  5. Python大数据分析实战:豆瓣电影Top250中的最佳导演是谁?

    在之前写的一篇文中中,已经采用urllib和BeautifulSoup的方式抓取了豆瓣电影TOP250的导演.编剧.演员.上映时间和地区.语言.短评数.影评数.多少人想看.多少人看过等22个字段. 接 ...

  6. ActiveReports 大数据分析报告:2018中国电影再次迎来黄金时代

    回顾2018,中国电影市场收获颇丰.先是凭借春节档<红海行动>.<唐人街探案>双双实现30亿票房突破,而后暑期档火力全开,<我不是药神>.<西虹市首富> ...

  7. 怎么能更好地利用好大数据分析

    随着数字技术的飞速发展,数据的种类和规模正在高速增长,大数据时代来临了.数据已从简单的需要处理的对象,变成一种十分重要的资源了. 庞杂的数据规模给数据存储.管理以及数据分析等都带来了很大的影响.原有的 ...

  8. 如何让大数据分析更有效

    如今,数据量越来越大.近年来,企业已经意识到数据分析可以带来的价值,并且已经开始采用.企业现在的设备几乎都在监测和测量,并创造了大量的数据,通常比企业处理的更快.其问题是,而正因为大数据定义为&quo ...

  9. 如何更好地优化大数据分析

    数据正在变得越来越重要,一些企业甚至把数据当成自己的"天".近年来越来越多的公司已经意识到数据数据分析可以带来的价值,并且已经跳上了大数据旅行车.实际上,现在所有的一切都在被监控和 ...

  10. 【大数据分析专业毕设之基于python爬虫的电影票房大数据预测分析+大屏可视化分析

    [大数据分析专业毕设之基于python爬虫的电影票房大数据预测分析+大屏可视化分析-哔哩哔哩https://b23.tv/saIKtBH flask web框架,数据使用requests模块爬取数据, ...

最新文章

  1. #2002 Cannot log in to the MySQL server, PHPMyAdmin/MySQL
  2. mysql四列数据表代码_MySQL数据库常用代码
  3. java控制台输入空格输出后不显示_为撒我加上输入输出流的代码后控制台反而什么都不显示了呢?...
  4. 【新功能,新插件】-全新来袭,CSDN浏览器助手这一款无广告干净界面插件你值得拥有!
  5. Java正则表达式应用
  6. 【AI初识境】深度学习中常用的损失函数有哪些?
  7. iOS开发系列文章(持续更新……)
  8. td 字典表_数据库怎么设计字典表
  9. 148. Sort List 1
  10. 设计模式-里氏替换原则
  11. Mac os x 系统的发展史
  12. Ubuntu Server 如何校对时钟(通过NTP)
  13. redis5 外部不能连接_基本拧紧技术,螺纹连接也有大不同!
  14. 用matlab画x 的定积分图像,matlab图像定积分
  15. 工厂模式(Factory Method)
  16. DaZeng:雪碧图(精灵图)的使用
  17. zigbee应用实践
  18. 天空里的云偶遇 彩虹做成衣裳也要用心呵护——潮港城的茶点,好芒果的冰饮...
  19. 怎样才能在微信朋友圈发长视频?
  20. 对接海康设备-vue

热门文章

  1. 硬链接(hard link)和符号连接(symbolic link)的区别
  2. 阿尔卑斯山时间规划法精髓(提高工作效率)
  3. 麒麟系统编译网卡驱动
  4. Friends 第一季英文学习整理
  5. 长江大学计算机基础试卷2018 2019,长江大学2017年第一学期-计算机基础试卷.doc
  6. 四川大学计算机在线作业,四川大学计算机操作系统试题
  7. 热门编程语言间的差异
  8. 峨眉山三日游攻略:带一个伤心的女纸,去峨眉寻一点清净
  9. NTC与PTC压敏电阻在电源电路中起的作用
  10. JVM参数-X和-XX的区别