推荐系统给电影评分排名的方法

在美国，有这么几个和豆瓣类似，主流网民经常访问的与电影有关的网站：专业存储电影信息兼职打分的IMDb（Internet Movie Database互联网电影数据库）、创立快二十年几经易手的烂番茄(Rotten Tomatoes)、专业网络购票副业打分的“美国猫眼”Fandango，以及专门聚合书籍和视听出版产品批评意见的Metacritic。

随着互联网和社交网站的快速普及，这几个网站也形成了独特的电影打分机制，虽然各不相同，但还都挺受电影市场片方、观众和专业批评人士的信任。这也让它们在国内甚至国际上成为了具有公信力的电影评分网站。

IMDb

Metacritic

烂番茄（Rotten Tomatoes）

Fandango

IMDb

IMDB网站是目前互联网上最为权威、系统、全面的电影资料网站，里面包括了几乎所有的电影，以及1982 年以后的电视剧集。IMDB的资料中包括了影片的众多信息，演员，片长，内容介绍，分级，评论等，就个人买碟而言，很大程度上也是参考IMDB的得分。它所特有的电影评分系统深受影迷的欢迎，注册的用户可以给任何一部影片打分并加以评述，而网站又会根据影片所得平均分、选票的数目等计算得出影片的加权平均分并以此进行TOP250（最佳250部影片）和Bottom100（最差100部影片）的排行。

根据IMDB网站上公布的TOP250评分标准，它所使用的是贝叶斯统计算法得出的加权分(Weighted Rank-WR)，公式如下：

R = average for the movie (mean) = (Rating) （是用普通的方法计算出这部电影的平均分）
v = number of votes for the movie = (votes) （投票人数，需要注意的是，只有经常投票者才会被计算在内）
m = minimum votes required to be listed in the top 250 (currently 1250) （进入imdb top 250需要的最小票数，只有三两个人投票的电影就算得满分也没用的）
C = the mean vote across the whole report (currently 6.9) （目前所有电影的平均得分）

仔细研究这个公式会发现，IMDB为每部电影增加了1250张选票，并且这些选票的评分都为6.9。这样做的原因是，假设所有电影都至少有1250张选票，那么就都具备了进入前250名的评选条件；然后假设这1250张选票的评分是所有电影的平均得分（即假设这部电影具有平均水准）；最后，用现有的观众投票进行修正，长期来看，v/(v+m)这部分的权重将越来越大，得分将慢慢接近真实情况。这样做拉近了不同电影之间投票人数的差异，使得投票人数较少的电影也有可能排名前列。

但需要明确的是，这个公式只是IMDb维护Top 250电影榜单所使用的，并不是每一部新电影打分都采用这个方法。平常，IMDb的用户可以用1-10颗星来为一部电影打分，最后IMDb会计算出一个加权平均星数作为得分。

为了维护评分的公正，日常评分的计算公式仍然是个不能公开的秘密。已知的是，结果依然是加权分，采用了算术平均数(Arithmetic mean)的计算方法，但由于算数平均数容易受到极端数据的影响，IMDb也设计了一些过滤机制。

可以看到IMDB上的评分完全来自于网民的评价，凭的是参与评价的网民的自身喜好，参与评分的网民越多，IMDB的评分越有可靠性。

Metacritic

Metacritic是一个出版物专业批评聚合网站，成立于1999年。最早从书评起家，现在的Metacritic的批评对象已经涵盖了音乐专辑、电影、电视剧、电子游戏等视听出版物。注意，重点在于“专业”二字。

要体现专业，首先，Metacritic为电影打出的Metascore是从主流媒体和专业影评机构的影评人那里聚合而来的，这是它和IMDb评分最主要的不同。这些影评人和他们供职的机构，大多在影评方面具有公信力，比如《卫报》、《纽约时报》、《滚石》、《好莱坞记者》，《时代周刊》和NPR等这样的大报和电台，都是能参与Metascore计算的专业影评来源。

但不是每个机构和影评人都会自己给出一个准确的分数。实际上Metacritic是这样做的：来源有分数就用来源分数；来源有星数就大概换算成百分制的分数；如果来源的影评只有文字没有评分，他们就自己找人去阅读影评，然后根据读完的感受自己给一个分，然后再用这个分拿去计算。

虽然这样计算出的Metascore，看上去不是特别能够准确和真实地体现批评家的感受，但至少这十几年过来Metacritic没怎么被质疑过。尽管如此，Metacritic在Metascore之外也还是设立了一个Userscore——不会展现在一部电影的页面上，但用户投票的工具会直接放在Metascore的下方，给用户一种投了票就能影响得分的错觉。

烂番茄（Rotten Tomatoes）

烂番茄创立于1998年，一直致力于提供具有公信力的电影打分。其创始人帕特里克·李曾经在Pingwest品玩的SYNC 2016科技大会上介绍过烂番茄的极盛时的风光和设立的机制。这么来看，烂番茄也算是影评界的不老松。

烂番茄没有评分！必须明确烂番茄采用的评价系统叫做Tomatometer，一般翻译成“新鲜度”。一部电影的新鲜度，同样是由专业的影评意见所决定的。在烂番茄上影评人不打分，也不给星，只能给出Fresh（一个新鲜番茄）和Rotten（一个烂番茄）两种标记，分别代表推荐和不推荐。

如果超过60%的影评人推荐一部电影，电影的新鲜度就会整体为Fresh，旁边有一个百分比显示新鲜度，也即具体多大比例的影评人推荐；如果超过75%的影评人推荐，新鲜度就会变成“Certified Fresh”；但如果给Fresh的影评人低于60%，电影就只能得到那一坨绿色的烂番茄了。

和Metacritic一样，烂番茄也需要确保用户的意见能够得到体现，于是又设定了一个Audience Score（观众分数）。这个观众分数采集来源是观众打星，但最后体现出来的所有打出3星半以上的用户比例。

用打好评的影评人/用户占总影评人/用户人数的比例，而不是一个简单的数值来评价一部电影，是烂番茄和其他影评网站在本质上的最大区别。它突出的是人群对一部电影持有的主流观点，而不是用一个无法让每个评价者都感同身受的数值。

Fandango

2000年成立的Fandango（原名Tickemaker），可以被理解为美国版猫眼。它慢慢统一了美国混乱的网络票务市场，现在最主要的功能就是网上买电影票，查座位情况，以及查看影评等等。

Fandango对粉丝、用户的地位和意见非常重视，在影评机制上得到了体现。Fandango的电影评价完全采用粉丝打分作为依据。

Fandango的评分计算方式看上去并不复杂，应该没有什么加权和过滤机制。这也导致了该网站上3星以下电影的数量比烂番茄、Metacritic和IMDb要少得多。幸好Fandango加上了比较专业和严苛的烂番茄新鲜度，以及专业的家庭电影评价机构意见（上图右上角），来中和什么烂片都能咽得下去的粉丝打分。

总的来说，

IMDb以用户打分为基础，使用过滤规则和加权算法来平衡分数；
Metacritic则主要考虑影评人的意见，专业度较高；
烂番茄分别考虑了用户打分和影评人打分，都是以百分比好评的方式展现影片口碑；
Fandango的原理最简单，完全依靠用户的打分。

推荐系统给电影评分排名的方法

IMDb

Metacritic

烂番茄（Rotten Tomatoes）

Fandango

推荐系统给电影评分排名的方法相关推荐

最新文章

热门文章