在美国,有这么几个和豆瓣类似,主流网民经常访问的与电影有关的网站:专业存储电影信息兼职打分的IMDb(Internet Movie Database互联网电影数据库)、创立快二十年几经易手的烂番茄(Rotten Tomatoes)、专业网络购票副业打分的“美国猫眼”Fandango,以及专门聚合书籍和视听出版产品批评意见的Metacritic。

随着互联网和社交网站的快速普及,这几个网站也形成了独特的电影打分机制,虽然各不相同,但还都挺受电影市场片方、观众和专业批评人士的信任。这也让它们在国内甚至国际上成为了具有公信力的电影评分网站。

目录

IMDb

Metacritic

烂番茄(Rotten Tomatoes)

Fandango


IMDb

IMDB网站是目前互联网上最为权威、系统、全面的电影资料网站,里面包括了几乎所有的电影,以及1982 年以后的电视剧集。IMDB的资料中包括了影片的众多信息,演员,片长,内容介绍,分级 ,评论等,就个人买碟而言,很大程度上也是参考IMDB的得分。 它所特有的电影评分系统深受影迷的欢迎,注册的用户可以给任何一部影片打分并加以评述,而网站又会根据影片所得平均分、选票的数目等计算得出影片的加权平均分并以此进行TOP250(最佳250部影片)和Bottom100(最差100部影片)的排行。

根据IMDB网站上公布的TOP250评分标准,它所使用的是贝叶斯统计算法得出的加权分(Weighted Rank-WR),公式如下:

  • R = average for the movie (mean) = (Rating) (是用普通的方法计算出这部电影的平均分
  • v = number of votes for the movie = (votes) (投票人数,需要注意的是,只有经常投票者才会被计算在内)
  • m = minimum votes required to be listed in the top 250 (currently 1250) (进入imdb top 250需要的最小票数,只有三两个人投票的电影就算得满分也没用的)
  • C = the mean vote across the whole report (currently 6.9) (目前所有电影的平均得分

仔细研究这个公式会发现,IMDB为每部电影增加了1250张选票,并且这些选票的评分都为6.9。这样做的原因是,假设所有电影都至少有1250张选票,那么就都具备了进入前250名的评选条件;然后假设这1250张选票的评分是所有电影的平均得分(即假设这部电影具有平均水准);最后,用现有的观众投票进行修正,长期来看,v/(v+m)这部分的权重将越来越大,得分将慢慢接近真实情况。这样做拉近了不同电影之间投票人数的差异,使得投票人数较少的电影也有可能排名前列。

但需要明确的是,这个公式只是IMDb维护Top 250电影榜单所使用的,并不是每一部新电影打分都采用这个方法。平常,IMDb的用户可以用1-10颗星来为一部电影打分,最后IMDb会计算出一个加权平均星数作为得分。

为了维护评分的公正,日常评分的计算公式仍然是个不能公开的秘密。已知的是,结果依然是加权分,采用了算术平均数(Arithmetic mean)的计算方法,但由于算数平均数容易受到极端数据的影响,IMDb也设计了一些过滤机制。

可以看到IMDB上的评分完全来自于网民的评价,凭的是参与评价的网民的自身喜好,参与评分的网民越多,IMDB的评分越有可靠性。

Metacritic

Metacritic是一个出版物专业批评聚合网站,成立于1999年。最早从书评起家,现在的Metacritic的批评对象已经涵盖了音乐专辑、电影、电视剧、电子游戏等视听出版物。注意,重点在于“专业”二字。

要体现专业,首先,Metacritic为电影打出的Metascore是从主流媒体和专业影评机构的影评人那里聚合而来的,这是它和IMDb评分最主要的不同。这些影评人和他们供职的机构,大多在影评方面具有公信力,比如《卫报》、《纽约时报》、《滚石》、《好莱坞记者》,《时代周刊》和NPR等这样的大报和电台,都是能参与Metascore计算的专业影评来源。

但不是每个机构和影评人都会自己给出一个准确的分数。实际上Metacritic是这样做的:来源有分数就用来源分数;来源有星数就大概换算成百分制的分数;如果来源的影评只有文字没有评分,他们就自己找人去阅读影评,然后根据读完的感受自己给一个分,然后再用这个分拿去计算。

虽然这样计算出的Metascore,看上去不是特别能够准确和真实地体现批评家的感受,但至少这十几年过来Metacritic没怎么被质疑过。尽管如此,Metacritic在Metascore之外也还是设立了一个Userscore——不会展现在一部电影的页面上,但用户投票的工具会直接放在Metascore的下方,给用户一种投了票就能影响得分的错觉。

烂番茄(Rotten Tomatoes)

烂番茄创立于1998年,一直致力于提供具有公信力的电影打分。其创始人帕特里克·李曾经在Pingwest品玩的SYNC 2016科技大会上介绍过烂番茄的极盛时的风光和设立的机制。这么来看,烂番茄也算是影评界的不老松。

烂番茄没有评分!必须明确烂番茄采用的评价系统叫做Tomatometer,一般翻译成“新鲜度”。一部电影的新鲜度,同样是由专业的影评意见所决定的。在烂番茄上影评人不打分,也不给星,只能给出Fresh(一个新鲜番茄)和Rotten(一个烂番茄)两种标记,分别代表推荐和不推荐。

如果超过60%的影评人推荐一部电影,电影的新鲜度就会整体为Fresh,旁边有一个百分比显示新鲜度,也即具体多大比例的影评人推荐;如果超过75%的影评人推荐,新鲜度就会变成“Certified Fresh”;但如果给Fresh的影评人低于60%,电影就只能得到那一坨绿色的烂番茄了。

和Metacritic一样,烂番茄也需要确保用户的意见能够得到体现,于是又设定了一个Audience Score(观众分数)。这个观众分数采集来源是观众打星,但最后体现出来的所有打出3星半以上的用户比例。

用打好评的影评人/用户占总影评人/用户人数的比例,而不是一个简单的数值来评价一部电影,是烂番茄和其他影评网站在本质上的最大区别。它突出的是人群对一部电影持有的主流观点,而不是用一个无法让每个评价者都感同身受的数值。

Fandango

2000年成立的Fandango(原名Tickemaker),可以被理解为美国版猫眼。它慢慢统一了美国混乱的网络票务市场,现在最主要的功能就是网上买电影票,查座位情况,以及查看影评等等。

Fandango对粉丝、用户的地位和意见非常重视,在影评机制上得到了体现。Fandango的电影评价完全采用粉丝打分作为依据。

Fandango的评分计算方式看上去并不复杂,应该没有什么加权和过滤机制。这也导致了该网站上3星以下电影的数量比烂番茄、Metacritic和IMDb要少得多。幸好Fandango加上了比较专业和严苛的烂番茄新鲜度,以及专业的家庭电影评价机构意见(上图右上角),来中和什么烂片都能咽得下去的粉丝打分。

总的来说,

  • IMDb以用户打分为基础,使用过滤规则和加权算法来平衡分数;
  • Metacritic则主要考虑影评人的意见,专业度较高;
  • 烂番茄分别考虑了用户打分和影评人打分,都是以百分比好评的方式展现影片口碑;
  • Fandango的原理最简单,完全依靠用户的打分。

推荐系统给电影评分排名的方法相关推荐

  1. python数据分析案例2:电影评分数据集的分析

    这里是南京财经大学的Mooc课程的个人学习笔记,课程网址是:https://www.icourse163.org/course/NJUE-1458311167,课程是免费的,老师讲的很好很认真,欢迎学 ...

  2. ML之KG:基于MovieLens电影评分数据集利用基于知识图谱的推荐算法(networkx+基于路径相似度的方法)实现对用户进行Top电影推荐案例

    ML之KG:基于MovieLens电影评分数据集利用基于知识图谱的推荐算法(networkx+基于路径相似度的方法)实现对用户进行Top电影推荐案例 目录 基于MovieLens电影评分数据集利用基于 ...

  3. php amazon-s3_推荐亚马逊电影-一种协作方法

    php amazon-s3 Item-based collaborative and User-based collaborative approach for recommendation syst ...

  4. 机器学习工程师 — Udacity 电影评分的 k 均值聚类

    电影评分的 k 均值聚类 假设你是 Netflix 的一名数据分析师,你想要根据用户对不同电影的评分研究用户在电影品位上的相似和不同之处.了解这些评分对用户电影推荐系统有帮助吗?我们来研究下这方面的数 ...

  5. 豆瓣电影评分分析(数据分析)

    本文主要通过对豆瓣电影爬取的数据进行的简要分析,观察得出各部分之间对应的关系影响. 一.数据抓取 我们要想进行数据分析,首先就要通过爬虫对分析对象网页的数据爬取保存,可以保存到数据库或者文件形式到本地 ...

  6. 实验报告:用协同过滤算法对电影评分,并使用RMSE算出预测误差

    实验报告 一.实验目的 1.学习利用hadoop处理大数据. 2. 通过实验加强mapreduce编程能力. 3. 在掌握协同过滤算法基础上通过mapreduce实现. 二.实验内容 1.使用给定的数 ...

  7. 【机器学习】k-Means Clustering_电影评分与推荐实例

    因本人刚开始写博客,学识经验有限,如有不正之处望读者指正,不胜感激:也望借此平台留下学习笔记以温故而知新. 电影评分的 k 均值聚类 假设你是 Netflix 的一名数据分析师,你想要根据用户对不同电 ...

  8. 【电影评分算法】豆瓣、猫眼、IMDb

    豆瓣评分:   评分对象--豆瓣注册用户(注册比较久的老用户评分才有作用,新用户的评分仅作参考)且不是"非正常打分"的帐号:   规则--一人一票,一星至五星,最后换算成10分制: ...

  9. 基于R语言构建的电影评分预测模型

    电影评分系统是一种常见的推荐系统.现在使用R语言基于协同过滤算法来构建一个电影评分预测模型. 一,前提准备         1.R语言包:ggplot2包(绘图),recommenderlab包,re ...

  10. 使用Requests库+re库爬取猫眼电影评分

    使用Requests库+re库爬取猫眼电影评分 作者:小胖 0x1: 分析 在简单的翻页中,我们可以知道.网页涵盖了以下几个规律 1.offset参数的值是除以30就是当前的页面 2.每个页面只有30 ...

最新文章

  1. 站在巨人的肩膀上“思考”问题,重在思考而不是拿来主义
  2. 一文全面了解基于内容的推荐算法
  3. 两天标星2.2K!GitHub 开源自动刷喵币项目?
  4. iphonex如何关机_iPhone X手机屏幕出现绿线怎么回事_屏幕绿线该如何处理?
  5. 2010年—2018年中国电商成交额排名
  6. js实现kmp算法_「leetcode」459.重复的子字符串:KMP算法还能干这个!
  7. 怪事,硬盘上的FC3_cd1的ISO莫名其妙被改变了
  8. 历时 4 年,阿里云推出金融核心系统转型实践书
  9. java static 块作用_java static块有什么具体的作用和注意事项?说具体点
  10. Tomcat Script(python)
  11. vue中指令的编译过程
  12. Prolog语言及程序设计汇总
  13. 【已解决ie浏览器不能打印预览的问题,页面跳转失败,无法打开】
  14. 截止频率计算公式wc_计算截止频率Wc的快速方法
  15. 最佳实践:MySQL CDC 同步数据到 ES
  16. 名帖41 伊秉绶 隶书《对联八幅》
  17. 统计学中假设检验有关P值的讨论
  18. R语言基础知识入门学习(一)
  19. Exchange 常见问题之十
  20. [转]步入成熟的无线视频应用 英特尔WiDi无线视频传输研究

热门文章

  1. 五年上市路,君亭才刚刚出发
  2. sd卡启动分区的制作--使用fdisk 工具
  3. 16本版式设计书籍推荐(附PDF链接)设计从业人员必备
  4. sap的pod确认_SAP POD 在途库存 SIT
  5. 蒸汽流量计算软件_补偿型涡街流量计
  6. 腾讯校招都会问些什么?| 五面腾讯(Java岗)经历分享
  7. DotNet 资源大全中文版,内容包括:编译器、压缩、应用框架、应用模板、加密、数据库、反编译、IDE、日志、风格指南等...
  8. 抖音小店怎么去添加淘宝链接?哪种推广适合淘客丨国仁网络资讯
  9. es6模板字符串和占位符${}
  10. 毕业论文页码格式制作