【机器学习 基本概念】泊松分布与美国枪击案
本文转载自:泊松分布与美国枪击案
作者: 阮一峰
日期: 2013年1月 8日
去年12月,美国康涅狄格州发生校园枪击案,造成28人死亡。
资料显示,1982年至2012年,美国共发生62起(大规模)枪击案。其中,2012年发生了7起,是次数最多的一年。
去年有这么多枪击案,这是巧合,还是表明美国治安恶化了?
前几天,我看到一篇很有趣的文章,使用"泊松分布"(Poisson distribution),判断同一年发生7起枪击案是否巧合。
让我们先通过一个例子,了解什么是"泊松分布"。
已知某家小杂货店,平均每周售出2个水果罐头。请问该店水果罐头的最佳库存量是多少?
假定不存在季节因素,可以近似认为,这个问题满足以下三个条件:
(1)顾客购买水果罐头是小概率事件。
(2)购买水果罐头的顾客是独立的,不会互相影响。
(3)顾客购买水果罐头的概率是稳定的。
在统计学上,只要某类事件满足上面三个条件,它就服从"泊松分布"。
泊松分布的公式如下:
各个参数的含义:
P:每周销售k个罐头的概率。
X:水果罐头的销售变量。
k:X的取值(0,1,2,3...)。
λ:每周水果罐头的平均销售量,是一个常数,本题为2。
根据公式,计算得到每周销量的分布:
从上表可见,如果存货4个罐头,95%的概率不会缺货(平均每19周发生一次);如果存货5个罐头,98%的概率不会缺货(平均59周发生一次)。
现在,我们再回过头,来看美国枪击案。
假定它们满足"泊松分布"的三个条件:
(1)枪击案是小概率事件。
(2)枪击案是独立的,不会互相影响。
(3)枪击案的发生概率是稳定的。
显然,第三个条件是关键。如果成立,就说明美国的治安没有恶化;如果不成立,就说明枪击案的发生概率不稳定,正在提高,美国治安恶化。
根据资料,1982--2012年枪击案的分布情况如下:
计算得到,平均每年发生2起枪击案,所以 λ = 2 。
上图中,蓝色的条形柱是实际的观察值,红色的虚线是理论的预期值。可以看到,观察值与期望值还是相当接近的。
我们用"卡方检验"(chi-square test),检验观察值与期望值之间是否存在显著差异。
卡方统计量 = Σ [ ( 观察值 - 期望值 ) ^ 2 / 期望值 ]
计算得到,卡方统计量等于9.82。查表后得到,置信水平0.90、自由度7的卡方分布临界值为12.017。因此,卡方统计量小于临界值,这表明枪击案的观察值与期望值之间没有显著差异。所以,可以接受"发生枪击案的概率是稳定的"假设,也就是说,从统计学上无法得到美国治安正在恶化的结论。
但是,也必须看到,卡方统计量9.82离临界值很接近,p-value只有0.18。也就是说,对于"美国治安没有恶化"的结论,我们只有82%的把握,还有18%的可能是我们错了,美国治安实际上正在恶化。因此,这就需要看今后两年中,是否还有大量枪击案发生。如果确实发生了,泊松分布就不成立了。
[参考阅读]
* 泊松分布,by 曹亮吉
* 卡方分布(PDF文件)
(完)
【机器学习 基本概念】泊松分布与美国枪击案相关推荐
- 泊松分布与美国枪击案
去年12月,美国康涅狄格州发生校园枪击案,造成28人死亡. 资料显示,1982年至2012年,美国共发生62起(大规模)枪击案.其中,2012年发生了7起,是次数最多的一年. 去年有这么多枪击案,这是 ...
- 用声音检测技术降低美国“赌城”枪击案伤亡(paper+github)
最近几天,大家都被美国"赌城"拉斯维加斯的2000人的音乐会的枪击案刷屏,59死,500+伤,是美国自911事件后,最大的伤亡事件.默哀!祈祷和平,没有暴力! 图为:美国华盛顿纪念 ...
- Python数据分析:美国警察枪击案EDA分析
本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. 以下文章来源于Python实用宝典 ,作者:肯德 前言 2014年在密苏里州一名叫做弗格森(Fer ...
- 女性更不容易受害? Python 美国警察枪击案探索性数据分析
2014年在密苏里州一名叫做弗格森(Ferguson)的警察杀害了迈克尔·布朗(Michael Brown)后,美国开始了一场抗议警察暴力对待黑人的运动-Black Lives Matter(黑人的命 ...
- PRML读书会第一章 Introduction(机器学习基本概念、学习理论、模型选择、维灾等)...
主讲人 常象宇 大家好,我是likrain,本来我和网神说的是我可以作为机动,大家不想讲哪里我可以试试,结果大家不想讲第一章.估计都是大神觉得第一章比较简单,所以就由我来吧.我的背景是统计与数学,稍懂 ...
- 安全重要还是隐私重要?面部识别技术帮助警方发现枪击案枪手
阅读全文请点击 先来看篇近期的报道: 报道指出,由于Jarrod Ramos的指纹信息被破坏,导致最初警方难以用指纹识别其身份.此前报道称,指纹识别失败相对普遍,一些业内人士估计错误率高达10%.其中 ...
- 佛罗里达州一银行发生枪击案 造成至少5人死亡
中新社休斯敦1月23日电 佛罗里达州赛百灵市一银行当地时间23日发生枪击案,造成至少5人死亡. 当地时间1月23日,美国佛罗里达州塞柏林(Sebring)镇一家银行发生劫持人质事件,多人遭枪击. 美国 ...
- 佛罗里达州银行枪击案嫌犯被诉以五项一级谋杀罪
中新社休斯敦1月24日电 综合媒体消息,美国佛罗里达州银行枪击案枪手,21岁的泽芬·赛维(Zephen Xaver)于当地时间24日被诉以五项一级谋杀罪. 美国全国公共广播电台24日消息说,赛百灵市警 ...
- 从零开始的AI·机器学习の基本概念
从零开始的AI系列 机器学习の基本概念 从零开始的AI系列 一.机器学习の相关术语及其理解 二.机器学习の学习任务 分类 回归 聚类 特征降维与低维可视化 三.机器学习の学习范式 监督式学习 半监督式 ...
最新文章
- 清华校长俯身拨穗!曾收病危通知书的博士毕业,刷屏的却是这个人
- CVPR2019 日程安排
- 1102: 火车票退票费计算(函数专题)
- golang应用部署
- UA OPTI570 量子力学17 创生算符与湮灭算符
- request.setCharacterEncoding(utf-8);
- 变声原理:卷积和传递函数
- 三分钟Docker-推送本地镜像到仓库
- SpringBoot YML配置文件
- [BZOJ4591][SHOI2015]超能粒子炮·改(Lucas定理+数位DP)
- [转帖]公司内网机器病毒
- 继腾讯后 B站又获阿里投资!加速二次元电商商业化
- 自学c语言中相关知识,设计出医院住院管理系统.要求如下所述:,C语言课程设计题Z目.doc...
- [poj3280]Cheapest Palindrome_区间dp
- 模块化编程的分层设计经验
- POJ NOI MATH-7833 幂的末尾
- 同时安装vs2005团队开发版和sql 2005企业版
- Java面经-海康威视
- ASP.NET Core的Telerik UI,创建数据丰富的桌面
- 电子密码锁程序C语言,基于51单片机的电子密码锁程序
热门文章
- 运用计算机技术创设英语课堂问题场,如何运用信息化技术手段优化英语课堂.docx...
- 宝元系统u盘使用说明_宝元系统简易操作指南
- BGP团体属性Community及 Community-filter路由操控
- [CQOI2014]危桥
- jq-weui滚动刷新,日历,和地址选择器
- 网安技术与应用(2)——基于DTLS的安全服务器设计
- android TV盒子开发遥控器按键的监听
- 《炬丰科技-半导体工艺》化合物半导体未来动力
- 安装SVN服务端软件VisualSVN
- 【0基础学java】教学日志:javaSE-面向对象6-接口、面向接口编程、内部类