本文转载自:泊松分布与美国枪击案

作者: 阮一峰

日期: 2013年1月 8日

去年12月,美国康涅狄格州发生校园枪击案,造成28人死亡。

资料显示,1982年至2012年,美国共发生62起(大规模)枪击案。其中,2012年发生了7起,是次数最多的一年。

去年有这么多枪击案,这是巧合,还是表明美国治安恶化了?

前几天,我看到一篇很有趣的文章,使用"泊松分布"(Poisson distribution),判断同一年发生7起枪击案是否巧合。

让我们先通过一个例子,了解什么是"泊松分布"。

已知某家小杂货店,平均每周售出2个水果罐头。请问该店水果罐头的最佳库存量是多少?

假定不存在季节因素,可以近似认为,这个问题满足以下三个条件:

(1)顾客购买水果罐头是小概率事件。

(2)购买水果罐头的顾客是独立的,不会互相影响。

(3)顾客购买水果罐头的概率是稳定的。

在统计学上,只要某类事件满足上面三个条件,它就服从"泊松分布"。

泊松分布的公式如下:

各个参数的含义:

  P:每周销售k个罐头的概率。

  X:水果罐头的销售变量。

  k:X的取值(0,1,2,3...)。

  λ:每周水果罐头的平均销售量,是一个常数,本题为2。

根据公式,计算得到每周销量的分布:

从上表可见,如果存货4个罐头,95%的概率不会缺货(平均每19周发生一次);如果存货5个罐头,98%的概率不会缺货(平均59周发生一次)。

现在,我们再回过头,来看美国枪击案。

假定它们满足"泊松分布"的三个条件:

  (1)枪击案是小概率事件。

  (2)枪击案是独立的,不会互相影响。

  (3)枪击案的发生概率是稳定的。

显然,第三个条件是关键。如果成立,就说明美国的治安没有恶化;如果不成立,就说明枪击案的发生概率不稳定,正在提高,美国治安恶化。

根据资料,1982--2012年枪击案的分布情况如下:

计算得到,平均每年发生2起枪击案,所以 λ = 2 。

上图中,蓝色的条形柱是实际的观察值,红色的虚线是理论的预期值。可以看到,观察值与期望值还是相当接近的。

我们用"卡方检验"(chi-square test),检验观察值与期望值之间是否存在显著差异。

  卡方统计量 = Σ [ ( 观察值 - 期望值 ) ^ 2 / 期望值 ]

计算得到,卡方统计量等于9.82。查表后得到,置信水平0.90、自由度7的卡方分布临界值为12.017。因此,卡方统计量小于临界值,这表明枪击案的观察值与期望值之间没有显著差异。所以,可以接受"发生枪击案的概率是稳定的"假设,也就是说,从统计学上无法得到美国治安正在恶化的结论。

但是,也必须看到,卡方统计量9.82离临界值很接近,p-value只有0.18。也就是说,对于"美国治安没有恶化"的结论,我们只有82%的把握,还有18%的可能是我们错了,美国治安实际上正在恶化。因此,这就需要看今后两年中,是否还有大量枪击案发生。如果确实发生了,泊松分布就不成立了。

[参考阅读]

  * 泊松分布,by 曹亮吉

  * 卡方分布(PDF文件)

(完)

【机器学习 基本概念】泊松分布与美国枪击案相关推荐

  1. 泊松分布与美国枪击案

    去年12月,美国康涅狄格州发生校园枪击案,造成28人死亡. 资料显示,1982年至2012年,美国共发生62起(大规模)枪击案.其中,2012年发生了7起,是次数最多的一年. 去年有这么多枪击案,这是 ...

  2. 用声音检测技术降低美国“赌城”枪击案伤亡(paper+github)

    最近几天,大家都被美国"赌城"拉斯维加斯的2000人的音乐会的枪击案刷屏,59死,500+伤,是美国自911事件后,最大的伤亡事件.默哀!祈祷和平,没有暴力! 图为:美国华盛顿纪念 ...

  3. Python数据分析:美国警察枪击案EDA分析

    本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. 以下文章来源于Python实用宝典 ,作者:肯德 前言 2014年在密苏里州一名叫做弗格森(Fer ...

  4. 女性更不容易受害? Python 美国警察枪击案探索性数据分析

    2014年在密苏里州一名叫做弗格森(Ferguson)的警察杀害了迈克尔·布朗(Michael Brown)后,美国开始了一场抗议警察暴力对待黑人的运动-Black Lives Matter(黑人的命 ...

  5. PRML读书会第一章 Introduction(机器学习基本概念、学习理论、模型选择、维灾等)...

    主讲人 常象宇 大家好,我是likrain,本来我和网神说的是我可以作为机动,大家不想讲哪里我可以试试,结果大家不想讲第一章.估计都是大神觉得第一章比较简单,所以就由我来吧.我的背景是统计与数学,稍懂 ...

  6. 安全重要还是隐私重要?面部识别技术帮助警方发现枪击案枪手

    阅读全文请点击 先来看篇近期的报道: 报道指出,由于Jarrod Ramos的指纹信息被破坏,导致最初警方难以用指纹识别其身份.此前报道称,指纹识别失败相对普遍,一些业内人士估计错误率高达10%.其中 ...

  7. 佛罗里达州一银行发生枪击案 造成至少5人死亡

    中新社休斯敦1月23日电 佛罗里达州赛百灵市一银行当地时间23日发生枪击案,造成至少5人死亡. 当地时间1月23日,美国佛罗里达州塞柏林(Sebring)镇一家银行发生劫持人质事件,多人遭枪击. 美国 ...

  8. 佛罗里达州银行枪击案嫌犯被诉以五项一级谋杀罪

    中新社休斯敦1月24日电 综合媒体消息,美国佛罗里达州银行枪击案枪手,21岁的泽芬·赛维(Zephen Xaver)于当地时间24日被诉以五项一级谋杀罪. 美国全国公共广播电台24日消息说,赛百灵市警 ...

  9. 从零开始的AI·机器学习の基本概念

    从零开始的AI系列 机器学习の基本概念 从零开始的AI系列 一.机器学习の相关术语及其理解 二.机器学习の学习任务 分类 回归 聚类 特征降维与低维可视化 三.机器学习の学习范式 监督式学习 半监督式 ...

最新文章

  1. 清华校长俯身拨穗!曾收病危通知书的博士毕业,刷屏的却是这个人
  2. CVPR2019 日程安排
  3. 1102: 火车票退票费计算(函数专题)
  4. golang应用部署
  5. UA OPTI570 量子力学17 创生算符与湮灭算符
  6. request.setCharacterEncoding(utf-8);
  7. 变声原理:卷积和传递函数
  8. 三分钟Docker-推送本地镜像到仓库
  9. SpringBoot YML配置文件
  10. [BZOJ4591][SHOI2015]超能粒子炮·改(Lucas定理+数位DP)
  11. [转帖]公司内网机器病毒
  12. 继腾讯后 B站又获阿里投资!加速二次元电商商业化
  13. 自学c语言中相关知识,设计出医院住院管理系统.要求如下所述:,C语言课程设计题Z目.doc...
  14. [poj3280]Cheapest Palindrome_区间dp
  15. 模块化编程的分层设计经验
  16. POJ NOI MATH-7833 幂的末尾
  17. 同时安装vs2005团队开发版和sql 2005企业版
  18. Java面经-海康威视
  19. ASP.NET Core的Telerik UI,创建数据丰富的桌面
  20. 电子密码锁程序C语言,基于51单片机的电子密码锁程序

热门文章

  1. 运用计算机技术创设英语课堂问题场,如何运用信息化技术手段优化英语课堂.docx...
  2. 宝元系统u盘使用说明_宝元系统简易操作指南
  3. BGP团体属性Community及 Community-filter路由操控
  4. [CQOI2014]危桥
  5. jq-weui滚动刷新,日历,和地址选择器
  6. 网安技术与应用(2)——基于DTLS的安全服务器设计
  7. android TV盒子开发遥控器按键的监听
  8. 《炬丰科技-半导体工艺》化合物半导体未来动力
  9. 安装SVN服务端软件VisualSVN
  10. 【0基础学java】教学日志:javaSE-面向对象6-接口、面向接口编程、内部类