培根曾经说过:“如果一个人以种种肯定的立论开始,他必将终止于各种怀疑;但如果他愿意抱着怀疑的态度开始,那么他必将获得肯定的结论。”我想对数据资料的判断和接收也是如此。虽然经验告诉我们“眼见为实”,但眼睛告诉我们的也许隐瞒了或者夸大了一部分事实。

启发:我们需要从数据挖掘出背后的真实原因,单纯的数据呈现,就有可能出现得到有偏差的结论,甚至导致制定错误的计划。

总结:

本书是一本如何利用统计以达到瞒天过海目的的入门读物。看上去,它很像骗子的行骗指南。就像一个已退休的窃贼在神不知、鬼不觉地撬锁的过程中,他的回忆录达到了研究生课程水平。但是毕竟,骗子早就掌握了行骗的技巧,而诚实的人出于自卫也应该学会它。

研究方面的收获

1.抽样存在内偏

耶鲁大学毕业生收入:参与调查的人本身就不能代表全部毕业生。它也仅仅代表了 1924 级耶鲁学生中可以联系到的,并愿意站出来说出所赚数目的这个特殊群体。

当数据经过层层统计处理,最后简化成一个小数形式的平均数时,结论似乎被确定的光环所笼罩,但只要再仔细留心整个抽样过程,这个光环就会破灭。

随机样本的检验标准是:总体中的每个名字或事物是否具有相同的几率被选进样本?

2.精心挑选的“平均数”

众数、平均数、中位数

买房的故事:
开发商:附近居民的年收入大约有 15000美元。
纳税者委员会的成员:附近居民的平均年收人只有 3500 美元

谁撒谎了呢?
其实。。两个数字都是合法的平均数,有着合法的计算方法!两个数字都代表着相同的数据、相同的居民、相同的收入。所有都是相同的,但显然至少有一个数据令人误解,足以与弥天大谎相媲美。
当希望数据较大时,算术平均数,即 15000 美元。小一些的是中位数,众数最小,即3500美元。

3.小样本的“魅惑”

使用多克斯(Doakes)牌牙膏将使蛀牙减少 23%!
揭秘:选择小样本,多次实验选择较好的那组

4.惊人的统计图形

绘图的手段会给人错觉,比如柱状图、陷入截去下面部分

《Newsweek》杂志:1951 年“股指创了 21 年新高”


5.平面图形


按照长宽比例,面积会是平方关系,让人感觉的立体物体是立方关系。在说“2 倍”的同时,最终给人留下的印象却是令人震惊的 8:l。

6.不相匹配的资料

如果你想证明某事,却发现没有能力办到,那么试着解释其他事情并假装它们是一回事。在统计资料与人类思维冲撞所引起的耀眼光芒中,几乎没有人会发现它们的区别。不相匹配的数据是保证你处在有利位置上的武器,而且通常如此。

如果我每天早上以 99 美分购进一件商品,并在中午以 1美元卖出,那我只获得 1%的收益,但是全年我却获得了投资额的 365%。

这是一个有趣的事实,在考虑某种疾病的发病情况时,使用死亡率或者死亡人数比发病人数更合理__这是因为死亡报道和死亡记录的质量更高。在此例中,明显不相匹配的数据比表面上完全匹配的数据还要好。

7.相关关系与因果关系

但这是一个古老的谬误,然而它仍频繁地出现在统计资料中,并被大量让人印象深刻的数据所伪装。这个谬误是:如果 B 紧跟着 A 出现,那么 A 一定导致 B。在上例中,当抽烟与低分同时出现时,人们得到了一个未经证实的假设,抽烟导致低分。难道就不能是相反的解释吗?也许低分促使学生不喝酒而变得爱抽烟。这种说法与前一种一样能得到证据很好的支撑。只是它不能够满足宣传人员的要求。

问题的关键在于,当有许多合理的解释时,你几乎没有权利选择对口味的解释并坚持认为它是正确的。但事实是许多人会这么做。

8.如何进行统计操纵

利用统计资料传递错误的信息而误导他人可称得上是一种操纵行为。用一个词来概括(虽然不一定很准确),那就是统计操纵。

联邦政府的开支与这些州的总收入相等

实际上.如果出版一本书的每项成本开支都上升 10%左右,总成本也只爬升了相同的比例,即 10%。

为了使最声名狼藉的统计资料看上去更有分量、更精确,你应该考虑使用小数和百分数。
询问100 个人昨晚的睡眠时间,进行加总,得到一个数值,比方说 783.1。任何类似的数据从一开始就不可能很精确,大部分人的回答与实际有出入,相差 15 分钟甚至更长时间都有可能,而且我们也不能保证所有的出人正负全部抵消。每个人都会有这样的经历,把 5 分钟的失眠说成是半宿的辗转反侧。不管怎样,还是先让我们继续下去。将 783.1 进行平均后宣布结论:人们平均每晚睡眠 7.831 小时。听上去,你似乎对正在讨论的话题胸有成竹。但如果你竟傻乎乎地宣布,人们平均每晚休息 7.8 小时(或者“差不多 8 小时”),数据就失去了动人的精确性。就像这个事情本身一样,它只不过是一个可怜的近似,而且和任何人的猜想一样毫无意义。
另一个困惑出现在百分比与百分点之间。如果某年的投资回报率为 3%,而第二年为 6%,你可以很谦虚地描述:增了 3 个百分点。同样,这样的描述也是允许的:增长高达 100%。要了解人们怎样混淆这两种说法,请观察民意选举的投票者。

9.对统计资料提出的五个问题

1.谁说的?
首先要寻找的是偏差,再仔细寻找无意识偏差
当某个权威人士被引用时,请弄清楚到底资料的内容是权威的,还是仅仅与权威人士沾边。
2.他是如何知道的?
注意样本的有偏.是由于选择不当,由刻意挑选有利的样本造成。对于相关系数也可以提同样的问题的。
3.遗漏了什么?
当均值与中位数相差甚远时,注意那些没有标明类型的平均数。
很多数据因为缺乏比较而变得没有意义。
有时仅给出百分数却缺少原始数据也能造成欺骗。
通常你无法了解样本包含了多少案例。这个数据的缺失,特别当信息的来源存在着利害关系时,已足以使 你对整件事情提出质疑。对一个没有经过可信度(可能误差、标准误差)检验的相关也不用太当真。
4.是否有人偷换了概念?
分析统计资料时,请留心从搜集原始资料到形成结论的整个过程中,是否存在着概念的偷换。
在相关事宜中自命不凡的胡说也是一种偷换概念的手法,即将“相关关系”偷换成“因果关系”
5.这个资料有意义吗?
当所接触到的资料是建立在未经证实的假设基础之上时,你可以发问,“这个资料有意义吗?”这个问题通常能将一个伪装得很好的统计资料打同原形。

社会科学方面的收获

  1. 医疗
    案例:

小儿麻痹症疫苗的实验:450 名儿童接种了疫苗,而 680名儿童作为对照组没有接受疫苗。这算是一个极大规模的医学实验。不久该区域感染了流行病,接种疫苗的儿童无一人患上小儿麻痹症。对照组的儿童也无一人患上该疾病。由于该病的低发生率。实验从一开始便注定是毫无意义的。15~20倍的样本容量也许才能产生足以解释某些事物的结果。

启发:
许多医学发现同样也是急急上马,“要快,”外科大夫说,“在还来得及之前尝试用新的治疗方法。” 这不能总是归咎于医生,有时公众压力和舆论宣传也会导致一个没有经过证实的治疗方法上马,特别当需求量很大而统计背景还很模糊时。

  1. 教育
  • 如果能给“准则”或者平均数加上反映全体范围的指标.许多误会将消除。
    仅仅描述了一些通过观察得到的事实,会使得那些阅读书籍和文章的父母错下结论:晚一天或晚一个月学会走路的孩子是低能儿。

  • 正常不等价于好的,对的
    对艾尔弗雷德·金西博士的著名报告(几乎没有人认真读过)所做的许多愚蠢批评正是将正常误解为好的、对的、应该如此的等价物。金西博士被指责有教唆年轻人的嫌疑,因为他向他们灌输某些观念,特别是将许多普遍存在却未经认可的性行为称为正常。实际上,金西博士只是指出他发现这种行为很普遍,而这便是正常所指,他并没有为这些行为贴上许可的标记,这些行为是否道德也并不属于他的研究范围。可见当涉及一个高度敏感的话题却不迅速表明你支持或反对的态度是十分危险的。

  • 注意用词模糊
    偏远山区用上电VS接上电,两者差别很大,接上不一定能用

《统计数据会说谎》阅读总结相关推荐

  1. 【读书】《非暴力沟通》

    得益于十点读书,在2月中完成开年来的第二本书籍阅读.本书作者马歇尔.卢森堡博士是国际性缔造和平组织非暴力沟通中心(CNVC)的创始人和教育服务主管,马歇尔.卢森堡博士由于在促进人类和谐共处方面的突出成 ...

  2. 《非暴力沟通》读书笔记

    <非暴力沟通>读书笔记 [本书作者] 马歇尔·卢森堡,卡尔·罗杰斯的弟子,同时其思想深受"圣雄"甘地和存在主义哲学大师马丁·布伯的影响. [本书要解答的问题] 是什么使 ...

  3. 摘录与感想:非暴力沟通

    摘录与感想:非暴力沟通 1.观察2.感受3.需要4.请求 首先,留意发生的事情.我们此刻观察到什么?不管是否喜欢,只是说出人们所做的事情.要点是,清楚地表达观察结果,而不判断或评估.接着,表达感受,例 ...

  4. 《非暴力沟通》:有些话真的可以好好说

    本文结构 - 前言 - 非暴力沟通简介 - 01 观察和评价 - 02 体会表达感受 - 03 感受背后的需求 - 04 提出请求 - 需求驱动 - 好好说话的力量 本文共计:3000字4图 预计阅读 ...

  5. 《非暴力沟通》- 笔记

    非暴力沟通的核心:当我们情绪受伤的时候,都是某些需求没有满足.你现在最要做的是发现需求,而不是发泄情绪.情绪是双刃剑,说出去很爽快,但会造成不好的后果. 非暴力沟通的步骤: 先说事实 再说感受 再说自 ...

  6. 2016年第7本:非暴力沟通

    周首送我的这本书<非暴力沟通>(NVC,Nonviolent Communication),是马歇尔·卢森堡博士发明的一种沟通方式,全书强调了四要素,共8个字:观察.感受.需要.请求.就是 ...

  7. 《非暴力沟通》听书心得

    沟通很多时候也是一门艺术,不是吗? 1.  一句话总结 非暴力沟通方法可以概况为四个字:观.感.需.求 观(观察).感(感受).需(需求).求(请求) 2.   精髓含义 观:仔细观察当下,而不要和& ...

  8. 【读书笔记】非暴力沟通

    文章目录 背景 理论 感受 反省 总结 推荐 背景 这个季度看了几本书,比如<一个人的朝圣>.<呼兰河传>.<元红>等等,女友也推荐了一本书给我,书名是<非暴 ...

  9. 读《非暴力沟通》马歇尔·卢森堡

    前言 非暴力生活的一个关键就是:感激生活的赐予,而不贪心 为了清晰的表达感受,我们编制了以下的词汇表 表达我们的需要得到满足时的感受 兴奋/喜悦/欣喜/甜蜜/精力充沛/兴高采烈/ 感激/感动/乐观/自 ...

  10. 《非暴力沟通》读后感

    最近几天偶然了发现桌角的kindle,才发现原来已经好久没有碰过她了.打开封盖,还有百分之60+的电量,着实让我一惊. 为了不让花出去的钱白白吃土,于是每天晚上睡觉前,就打开kindle看一会儿, 最 ...

最新文章

  1. 在Win 2003中配置ASP.net环境
  2. Utilize Sql Tuning Advisor from Script
  3. boost::regex模块实现将 C++ 文件转换为语法突出显示的 HTML的测试程序
  4. Android + Eclipse + PhoneGap 2.9.0 安卓最新环境配置,部分资料整合网上资料,已成功安装....
  5. 【WC2014】紫荆花之恋【替罪羊思想】【动态点分树】【替罪羊树】
  6. 计算机相关货品类别,工业计算机的种类以及产品供应链
  7. TCP握手为什么需要三次通信
  8. python输出由1234组成的三位素数_编写程序,输出所有由 1 、 2 、 3 、 4 这 4 个数字组成的素数,并且在每个素数中每个数字只使用依次。_学小易找答案...
  9. JAVA 的StringBuffer类
  10. 与众不同 windows phone (18) - Device(设备)之加速度传感器, 数字罗盘传感器
  11. libtool: Version mismatch error
  12. 河南大学软件学院宿舍楼综合布线设计方案
  13. 命令行调用SQL查询分析器
  14. 基于matlab的倒立摆系统,基于matlab的一级倒立摆系统仿真研究
  15. 单片机简易计算机设计实物,单片机设计的带余数的简易计算器
  16. vue框架对接手机app
  17. 基于aircrack-ng、crunch的wifi握手包爆破
  18. 跨境支付产品:现钞与现汇
  19. QT 输入框禁止window10触摸屏弹出键盘
  20. 阐述免费增值游戏的设计特点及注意事项

热门文章

  1. matlab中erf什么,matlab中的误差函数erf是什么意思?
  2. OpenCV-像素值读写(java版)
  3. \x3c\x73\x63\x72\x69\x70\x74\x3ealert('xss');\x3c\x2f\x73\x63\x72\x69\x70\x74\x3e
  4. python中安装pip_Python中如何安装pip-百度经验
  5. php 后天的时间戳,Linux中时间戳转换命令
  6. spring手动控制事务开启_手动控制spring事务
  7. protobuf和json的对比
  8. Python及IPython安装使用
  9. 认识计算机硬件.ppt,认识计算机硬件完整ppt课件
  10. 神经网络 BPNN 机器学习 深度学习 拟合 时间序列 预测 分类