在索尼准备推出PS5的时候,微软绞尽脑汁想办法在下一款游戏机的名称中加入字母“X”,现在是回顾第八代视频游戏机的好时机,我们来尝试使用假设检验判断哪一款游戏机,可以说是“最好的”。

索尼在2013年推出的PS4销量超过了1.1亿台(XBox One在同一时间段内的销量令人失望,达到了4700万台,而Switch在2017年发布后的销量也达到了5500万台)。当然,这些统计数据对消费者的影响很小,我们只能假设,消费者对游戏机的商业性能的关注程度,不如他们对游戏质量的关注。但我们如何判断游戏的质量呢?正如这句话所说:萝卜青菜,各有所爱。

克服主观性是本篇文章的主旨。特别是我们将依靠游戏的“元临界分数”来衡量游戏的“内在质量”。需要提醒的是,元评分(MetaScore)是给定标题的所有可用评论评分的加权平均值,并“根据其质量和总体地位”给予某些评论员额外的权重。因此,我们用于此分析的数据集是通过MetaCritic网站生成的(https://www.metacritic.com/about-metascores)

我们抓取了以下的数据:

  • 我们在三个主机(PS4、XBox One和Switch)上的13334个条目。

  • 许多游戏没有指定元分级。产生的原因是没有足够的评论来聚合一个评论。

  • 同一游戏对于其上可用的每个主机都有不同的内容。

  • 给定游戏的元评分可能会有很大的变化,这取决于评论所针对的主机。

衡量两个游戏机中哪一个最好的最公平的方法是只检查出现在两个主机的游戏。事实上,如果我们看一下每个主机上可用游戏数量的文氏图( Venn diagram),我们会发现它们之间存在着明显的重叠——特别是PS4和XBox One之间(技术上更为相似,并且几乎同时发布)。

非独占游戏

假设我们想调查一下,对于PS4和XBox One上都有的游戏,哪个版本更有可能获得更好的元得分。要做到这一点,我们首先分离至少有这两个主机的元分数的标题,然后,在一个游戏的基础上,从另一个游戏机中减去一个游戏机的分数(在本例中,从XBox one中减去PS4)。


让我们使用seaborn的KDE图可视化这些分数差异


我们可以看到,与PS4相比,游戏在XBox One上的总分平均略高。话虽如此,差距似乎很小(平均略高于1分),而且幅度相当大,两边都是平均值。综上所述,我们能否得出结论,主机之间的平均差异是显著的?这听起来很像假设检验的依据,所以让我们想想这样的检验可能是什么样的。

如果我们试图证明一个游戏在一个主机上的元得分与另一个主机上的元得分之间存在显著差异,那么我们需要拒绝它们之间没有差异的假设。

一个稍微微妙的点将有助于告诉我们如何进行-虽然我们已经抓去了整个元批评,但是我们仍然在处理一个游戏样本,而不是一个群体(我们分析的时候排除了没有元得分的游戏,因此,根据定义,正在使用两个主机上可用的所有游戏的子集)。

在总体水平上,一个游戏在任何两个游戏主机上的平均分差确实是零。当然,流行度的平均值是0。为了证明两个主机之间存在显著差异,我们需要证明我们的样本绝大多数不可能是从假设的零均值总体中提取的。

这是几乎任何一个样本假设检验的逻辑基础,但是当我们解释结果时,从第一原则考虑这些问题(而不是盲目地将数字插入公式中)是有用的,并且将有助于确保我们得出正确的结论。回到手头的问题-我们现在可以陈述我们的无效和可选假设:

H₀:主机之间的平均差异=0

Hₐ:主机之间的平均差异≠0

下一步是定义我们的α(当我们不应该拒绝H₀时,我们拒绝H₀的可接受概率)。0.05对大多数人来说是一个足够好的α,所以对我们来说已经足够好了。换言之,如果我们真的拒绝H₀,那么我们这样做的错误几率只有5%。

要确定是否可以拒绝H₀,我们现在需要创建“T-Statistic”,它由以下公式给出:


其中x是样本均值,μ是总体均值,s是样本标准差,n是样本量

我们可以将其与T分布(具有适当的自由度)进行比较,并绘制出T-Statistic,这里显示为一条垂直红线。这个T-Statistic产生一个p值,相当于红色T-Statistic右边T分布下的面积。

XBox One对PS4。蓝色曲线下总共有5%的区域是粉红色的,这反映了我们选择α=0.05。

我们可以从视觉上看到,我们的p值将远远低于α阈值0.05。由此,我们可以拒绝无效假设并得出结论,对于同时出现在PS4和XBox One上的游戏,xboxone版本更可能具有更高的元临界分数。

顺便说一下,我们可以遵循完全相同的过程来表明:

游戏在XboxOne上的得分要明显高于switch。


与Switch相比,游戏更有可能在PS4上获得更高的分数(尽管在这种情况下,对空假设的拒绝要少得多)。

独占游戏

所以我们能得出结论,XBox One是最好的第八代游戏机吗?我们实际上忽略了数据集中一半的作品。事实上,如果我们调查PS4的前十个元得分,我们会发现其中有七个是主机独占(因为它们在XBox或Switch上都不可用)。

同理,任天堂Switch的前十大游戏中有一半在XBox或PlayStation上找不到…

XBox one前十名中只有一款游戏是独占的。

PS4和Switch拥有最好的独占性的这一观察似乎得到了证实——Switch的独占性的平均得分最高,而XBox One的得分最低

我们怎样才能更严谨地得出这个结论呢?我们处理的是样本,而不是种群。尽管我们的数据集包含了许多现有的主机独占游戏,但有些游戏没有元得分,因此被排除在分析之外。

我们再次采取假设检验的方法。如果我们想证明主机A排他性比主机B上的排他性高得多,我们需要以某种方式拒绝一个陈述相反情况的无效假设:

H₀:主机A排他性的平均得分≤主机B排他性

Hₐ:主机A排他性>主机B排他性的平均得分

注意,虽然先前测试中的无效假设检验了两个总体平均值是否相同,但这里我们假设了一些稍有不同的情况-一个总体平均值要么与另一个相同,要么小于另一个。这意味着我们将进行“单尾”测试。

我们还需要记住一些其他事项:

  1. 样品有不同的大小(例如PS4有1675独占游戏,而XBox只有854个)

  2. 样本的总分有不同的标准差

  3. 不明显的是样本是从正态分布中提取的-它们的KDE图看起来都是负偏斜的

韦尔奇T检验是我们常规T检验的一种变异,它能更好地处理不同大小和变异的样本。但是,它仍然假设数据是正态分布的。如果我们得出结论,我们的样本不是从正态分布总体中提取的,那么我们应该转向非参数方法,例如排列测试。

如果我们在专业的背景下处理这个问题,我们可以运行Kolmogorov-Smirnov检验来对样本的正态性做出明确的决定。为了便于说明,让我们暂时忽略这一点,尝试两种方法,看看我们得到了什么结果。

我们看到参数和非参数测试在每种情况下都返回几乎相同的p值。事实证明,对我们的样本进行Kolmogorov-Smirnov检验表明,它们确实不太可能来自正态分布的人群

总结

从假设测试中我们可以得出的结论是,XBox One在三款游戏机中的主机独占游戏绝对是最差的。虽然Switch的排他性得分高于PS4的平均分,但这一差异似乎没有统计学意义。

因此,决定一个“获胜”的第八代游戏机取决于你作为玩家需求,尤其是你看重的游戏。所以还是根据游戏选主机吧。

使用假设检验分析PS4,XBox,Switch 谁是最好的游戏主机相关推荐

  1. 数据分析——假设检验分析方法

    文章目录 前言 一.假设检验分析方法是什么,作用是什么? 二.步骤 1.提出假设 2.收集证据 3.得出结论 总结 前言 哈喽,大家好呀,我是小白~~ 今天学习了数据分析方法中的假设检验分析方法,以下 ...

  2. 【数据分析】数据分析方法(五):假设检验分析方法

    数据分析方法(五):假设检验分析方法 假设检验分析方法的底层思想其实很简单,就是逻辑推理.这个逻辑推理在我们生活中无处不在,如果你看过<神探狄仁杰>.<白夜追凶>.<唐人 ...

  3. 计算机游戏高少手电影,支持switch,还有电影特技!上手简评骨伽IMMERSA Ti游戏耳机...

    支持switch,还有电影特技!上手简评骨伽IMMERSA Ti游戏耳机 匿名用户 2019-05-02 13:38:05 3点赞 4收藏 11评论 [引言] 随着国内电竞行业的兴起以及电竞游戏的普及 ...

  4. 【我的渲染技术进阶之旅】关于C++轻量级界面开发框架Dear ImGui介绍

    文章目录 一.怎么知道ImGui的 1.1 Filament中有使用ImGui 1.2 其他很多渲染框架都有使用ImGui 二.ImGui介绍 2.1 ImGui风格 2.2 Imgui介绍 2.2. ...

  5. 你最喜欢哪款游戏的界面风格,为什么?

    http://www.sohu.com/a/234772516_258858 每到周末,3DM的几位编辑就会聚在一起,总结上周做了些什么,商量下周该写些什么.讨论中途就诞生了这篇「一周一会」的话题文章 ...

  6. 疫情下的远程办公与桌面分享

    疫情下的远程办公与桌面分享 远程办公 相信很多小伙伴们正因为这次疫情都窝在家里远程办公吧,我也一样,都在等具体的复工通知,我们暂定会在3月份复工~当然也有可能会提前.那么这次我们来聊聊远程办公. 其实 ...

  7. bufferedreader接收不到数据_PS4、Xbox手柄和Switch跨次元组队?全靠八位堂USB无线接收器...

    起因 应该不止我一个人是这样吧,喜欢玩Switch,但是不喜欢用Joy-Con手柄!因为无论是和手掌的贴合度还是按键的操作感,相比于专业的游戏手柄. 即使有装Joy-Con的握把,依然无法弥补手感上的 ...

  8. xbox无线适配器驱动_手柄杂谈,PS4手柄,Xbox手柄使用感受

    手柄 北通 北通阿修罗手柄,连接方式USB,按键分布与xbox360手柄类似,PC使用无需额外下载软件驱动等,可能是硬件不兼容,只支持部分steam游戏. PS4 PS4 pro原装手柄,连接方式有线 ...

  9. v64.06 鸿蒙内核源码分析(索引节点) | 谁是文件系统最重要的概念 | 百篇博客分析OpenHarmony源码

    子曰:"君子博学于文,约之以礼,亦可以弗畔矣夫!" <论语>:颜渊篇 百篇博客系列篇.本篇为: v64.xx 鸿蒙内核源码分析(索引节点篇) | 谁是文件系统最重要的概 ...

最新文章

  1. Python Qt GUI设计:窗口布局管理方法【强化】(基础篇—6)
  2. Uber获土豪沙特35亿美元投资 不过别期待补贴增加
  3. mysql jdbc连接 优化_java+mysql连接的优化
  4. 手把手教你在 Ubuntu16.04 安装 GPU 驱动 + CUDA9.0 + cuDNN7
  5. celery定时任务简单使用
  6. VMWare 安装 Linux
  7. Android SDK Manager 在win8.1上的闪退问题【转载】
  8. SUSE11 搭建iscsi target 配置
  9. Kali下安装Wiznote
  10. Steam挂了加速器还是打不开商店?库?黑屏?一招教你解决。
  11. angularjs防抖
  12. Koo叔说Shader—Shader简介
  13. 网页版python编辑器-史上超强 Python 编辑器,竟然是张网页?!
  14. 正在保存备份的驱动器与启动计算机,如何创建和使用Dell Recovery Restore USB驱动器...
  15. 系统架构设计师考点全纪要(自己整理,本人一次稳过)
  16. 2021-04-09
  17. android sdk引入 微信分享_Android分享 ShareSDK微信分享详解
  18. netstat和netstat -ano
  19. 计算机类国企门槛,大学生想进“国家电网”,3个条件缺一不可,少一个将与国企无缘...
  20. 在线直播源码中直播间内大转盘功能的实现

热门文章

  1. 苹果平替笔性价比高的,苹果ipad触控笔推荐
  2. 教你如何谈朋友噢!!!zz
  3. SKUA-GOCAD建模常见问题汇总
  4. React报错 Too many re-renders
  5. [LED]如何配置LCD背光和LED,调试方法
  6. Opencv获取电脑摄像头抓拍的信息,
  7. jsp+ssm计算机毕业设计演唱会售票系统【附源码】
  8. 中国人工智能领域企业分类(附未来企业排行)
  9. 解决Google-Chrome浏览器无法打开Kubernetes-K8S-Dashboard页面
  10. xpath爬取airbnb民宿价格信息,为啥用属性定位不到元素,但是用文本内容模糊匹配却可以