从新手运气到幸存者偏差

Esri 中国 卢萌

赌徒都相信“初学者总是有运气”的。几乎所有的赌徒都认为“虽然后来运气会慢慢变差,但是刚开始赌的时候总是很走运的”。

抛开职业赌场,庄家放长线吊大鱼的不算。就算在股市上也经常有这种案例,新人入行的时候,运气都特别的好。

是否真有新手运气这一回事呢?在讨论这个问题之前,我们先来看看统计学里面的一个专业名词“幸存者偏差(Survivorship bias)”,另外也有译为“生存者偏差”或“存活者偏差”,是一种常见的逻辑谬误(“谬误”而不是“偏差”),意思是只能看到经过某种筛选而产生的结果,而没有意识到筛选的过程,因此忽略了被筛选掉的关键信息。这东西的别名有很多,比如“沉默的数据”、“死人不会说话”等等。

他最早来源二战时候的一个故事。

第二次世界大战时候,美英联军对德国展开战略大轰炸,因为德军的防空火力空前强大,所以盟军的飞机损失惨重。空军和飞行员都强烈要求增强战斗机的防护能力,最简单的方法就是在飞机上加装防弹装甲。

但是二战时候的飞机发动力马力有限,如果全部加装装甲,那么就会整个机体都超重,导致起飞困难和操作迟钝的问题。所以只能局部加装防弹装甲。

军方邀请了哥伦比亚大学的著名统计学家亚伯拉罕.沃德(Abraham Wald)教授,对德军防空火力击中的联军飞机进行分析。

沃德教授给飞机维修人员发放一张统计表格,让他们在表格上把飞机中弹的部位画出来。经过一段时间后,汇总成了两张表格,其中,机翼上的中弹点最多,而发动机和飞行员座舱基本上是空白,几乎一弹未中。

军方负责人看见这份统计报告之后,马上决定,把装甲安装在机翼上。但是沃德教授马上制止了军方的决定。

因为沃德教授认为,这份统计报告,是我方的维修人员,从飞回来的飞机上统计出来的结果。也就是说,虽然机翼中弹很多,但是中弹之后还能够顺利返航,恰恰说明机翼并非最需要防护的部分。而发动机和驾驶舱完全没有中弹的记录,是因为,只要这两个地方如果中弹,飞机几乎百分之百的坠毁了。所以,发动机和驾驶舱才是最需要防护的部分。

被击中了发动机和驾驶舱的飞机,都被击落了所以没有进入到被研究的样本中。它们都变成了“不会说话的死人”。

这种现象,就是统计学里面的幸存者偏差现象。当你收集的数据的前提若有错误的时候,再漂亮的统计算式或方法、再多的资料,也不能让后面的推论变得正确。

如此看来,前面我们所见的“新手幸运“说,就是一种幸存者偏差现象。

首先我们都知道,在赌场,或者在股市,赌徒都是处于劣势,赌场或者说庄家都是处于优势地位。那么首先去赌的话,如果赢了(走运),那么大部分这样新手赌徒,都认为自己受到了命运的垂青,而会继续赌下去。

输了的那些呢?他们可能会感到失望,然后停止赌博,因此,当赌徒的样本被统计的时候,这些离开了赌桌的失败者,就不会出现在样本中。

失败者可能会去看鸟、涂鸦、当海盗,或是从事其他的消遣活动。而继续赌博的人会记得自己曾经是走运的新手。放弃了赌博的人,从定义上将已经不是属于赌徒的行列了,所以统计的时候,凡是赌徒,都是属于幸运的新手的状态。

台大刘顺仁教授在著作《决胜》一书中, 对“幸存者偏差”举例说明,是最生动贴切又清楚的一个。

他讲了一个这样一个骗钱的例子(这已经进化到E-mail版)。

1月2日你接到一封匿名信,这封信向你表示,这个月市场会上涨,结果是市场果然上涨,但你不以为意,因为大家都知道有元月效应这回事(历年来一月间股价涨多跌少)。

到了2月1日,你又接到另一封信,向你表示,市场将下跌。这一次,又给那封信说中了。

3月1日再接到一封信,情形一样。这样的话你对那位匿名人士的先见之明很感兴趣,然后对方邀你投资某个海外基金。

于是你把全部的储蓄拿出来投资, 两个月以后,那些钱有如肉包子打狗,一去不回。你伏在邻居的肩膀上嚎啕大哭,他告诉你,他也接过两封这种神秘信,但寄到第二封就停了。他说,第一封信的预测正确,但第二封不正确。

这是怎么一回事?

那些骗子玩的把戏是,他们从电话簿找出一万个人名,寄出后市看涨的信给其中一半的人,后市看跌的信给另一半的人。

一个月后,将有五千人接到的信预测正确, 然后再针对这五千人如法炮制。

再一个月后,剩下二千五百人接到的信预测正确,如此直到名单上剩下五百人,其中会有两百人受骗上当,因此骗子只要花几千美元的邮资,便可赚进数百万美元。

这个就是“幸存者偏差”,只要信息不流通,那么“死人是不会说话的“,其他人就不知道这个骗子是有多么的(不)准。

从新手运气到幸存者偏差相关推荐

  1. 从新手运气看幸存者偏差

    赌徒都相信"初学者总是有运气"的.几乎所有的赌徒都认为"虽然后来运气会慢慢变差,但是刚开始赌的时候总是很走运的". 抛开职业赌场,庄家放长线吊大鱼的不算.就算在 ...

  2. 程序员找工作那些事(一)幸存者偏差

    这篇博客,早就想写了.一是这个问题飞哥被问得最多(可能仅次于"该不该转行"),二是看到太多太多"自以为是"的回答,以及半途而废的遗憾,好多话憋在心里不吐不快. ...

  3. 论创业者的幸存者偏差

    无论是在创业还是做一个单纯的产品设计时,我们都会采取借鉴他人的方式来解决当下遇到的问题.大多数人会根据存在即合理的原则,将市场上各种所谓之成功案例拼装在一起,当他们把这看似完美的杰作推向市场时,却发现 ...

  4. 幸存者偏差:实现成功不是复制成功者,而是学习失败者

    1 英国著名魔术师和催眠师德伦·布朗在一个纪录片中,展示了一个心理骗局. 方法很简单.首先,获得一张数量足够大的联系人列表,给列表上的每个人发电子邮件说,你有能力预测到赛马的结果,并且你会向他们证明这 ...

  5. 幸存者偏差与创业鼓吹

    本文原载自 SURVIVORSHIP BIAS AND STARTUP HYPE 原创翻译, 已获原作者授权 点击查看详情 运气在商业成功上起到重要作用. 在任何公司的胜利成功上都能有所体现, 而不仅 ...

  6. 用户数据中的幸存者偏差

    幸存者偏差(Survivorship bias)是一种常见的逻辑谬误,意思是没有考虑到筛选的过程,忽略了被筛选掉的关键信息,只看到经过筛选后而产生的结果. 先讲个故事. 二战时,无奈德国空防强大,盟军 ...

  7. 终于有人把幸存者偏差讲明白了

    导读:本文带你了解数据收集的偏差. 作者:徐晟 来源:大数据DT(ID:hzdashuju) 数据收集是一项重要的工作,需要投入大量精力和时间,这是因为数据质量直接关乎分析结论的成败.然而,错误的数据 ...

  8. [数据分析方法论]互联网人必须要懂的“幸存者偏差”

    不管你是否听过这个词,这篇文章都会让你对"幸存者偏差"理解的更加深刻,先让我们来看几个段子: 学校组织郊游,老师问:没来的同学举个手,好,人齐了,我们出发吧! 央视记者在一辆高铁上 ...

  9. 幸存者偏差——讨论死在中国游戏圈的一百万种方式

    http://www.gameres.com/460460.html 首先,用一个简单的案例向大家介绍一下什么是"幸存者偏差". 二战期间,盟军需要对战斗机进行装甲加厚,以提高生还 ...

最新文章

  1. git解决“failed to push some refs to“问题
  2. python win32库与subprocess_依赖管理:Python2.7需要subprocess32
  3. 计算机二级考试题 花纹,练习五(计算机二级考试OFFICE高级应用考试卷).doc
  4. 使用DOM生成XML文件(转)
  5. 'GO' 附近有语法错误问题,我真是无语~
  6. 电子邮件链接mailto_“ 3个链接”电子邮件的历史记录以及曾经发送的每个链接的存档...
  7. ss命令在linux上的安装
  8. 正确的座机号码格式_简历里的手机号及座机号的标准写法是什么?正确书写才更可能求职成功!...
  9. 中国象棋马走日(要求打印每一种走法) — 递归
  10. 计算机三维艺术设计基础,计算机艺术设计基础(修订版)
  11. vscode中setting设置
  12. 验证元素的唯一性(二重循环法和快排优化)
  13. matlab已知函数表达式画函数图像,怎么用matlab画已知函数表达式的一个函数图像?函数比较复杂的……...
  14. 平方面积怎么测量?教你快速学会这个方法
  15. PlaintextAttack
  16. Handler的理解
  17. 【读点论文】CMT: Convolutional Neural Networks Meet Vision Transformers
  18. 尚硅谷大数据hadoop教程_mapReduce
  19. 浅析Docker容器的应用场景
  20. C库函数 ——strstr、strtok的详解

热门文章

  1. (原創) M型化的NB使用族群:談ASUS Eee PC的爆紅對應用程式開發的影響 (OS) (Linux)...
  2. 【写在中秋时刻】硬件冷钱包、软件冷钱包、多签(Multisig)钱包多视角比较分析
  3. Failed to load JVM DLL
  4. 如何理解第三方支付清算和结算?
  5. 解读GDPR | 你应该知道的那些事儿
  6. nod-1625-夹克爷发红包
  7. 高博RGBD SLAM
  8. 高博基于stereo-imu的VO运行尝鲜
  9. (转)编程的三层境界——器、术、道
  10. 远征日服·信喵之野望 按键精灵脚本6.高级自动抽吉