转载请注明:http://blog.csdn.net/ningyaliuhebei/article/details/46409215

一。泊松分布由二项分布引出(二者都是离散型随机变量

首先必须由二项分布引出:

如果做一件事情成功的概率是 p 的话,那么独立尝试做这件事情 n 次,成功次数的分布就符合二项分布。展开来说,在做的 n 次中,成功次数有可能是 0 次、1 次 …… n次。成功 i 次的概率是:

( n 中选出 i 项的组合数) * p ^ i * (1-p)^ (n-i)

以上公式很容易推导,用一点概率学最基本的知识就够了。因为每一特定事件成功的概率是 p ,不成功的概率是 1-p 。i 次成功的事件可以任意分布在总共的 n 次尝试中。把它们乘起来就是恰好成功 i 次的概率。

当我们把二项分布推而广之后,就可以得到波松分布。

可以这样考虑,在一个特定时间内,某件事情会在任意时刻随机发生(前提是,每次发生都是独立的,且跟时间无关)。当我们把这个时间段分成非常小的时间片构成时,可以认为,每个时间片内,该事件可能发生,也可能不发生。几乎可以不考虑发生多于一次的情况(因为时间片可被分的足够小)。

当时间片分的越小,该时间片内发生这个事件的概率 p 就会成正比的减少。即:特定时间段被分成的时间片数量 n 与每个时间片内事件发生的概率 p 的乘积 n*p 为一个常数。这个常数表示了该事件在指定时间段发生的频度。

回过头来再来看这段时间内,指定事件恰好发生 i 次的概率是多少?代入上面推导出来的公式得到:

n * (n-1)... (n-i+1) / i! * p^i * (1-p) ^ (n-i) => np(np-p)...(np-ip+p) / i! * ((1-p) ^ (-1/p))^(-np) / (1-p) ^i

当 n 趋向无穷大时,p 趋向 0 。而此时 (1-p)^(-1/p) 趋向 e 。注:详细推导过程如下

上面这个公式可以划简为 lamda ^ i / i! * e ^ - lamda (lamda=n*p)

这个公式推导过程不复杂,耐心点一看就明白。而这个关于 i 的分布就是著名的泊松分布了。

二。泊松分布的应用:

首先泊松分布只能用来计算次数,例如汽车站候车人数就符合泊松分布,第一个人候车与第二个人后车没有关系,就像二项分布的独立重复试验一样。见图,

理解二项分布与泊松分布的关系

在推算某些特殊事件在一段时间内可能发生次数的时候经常会用到泊松分布。

泊松分布适合于描述单位时间内随机事件发生的次数的概率分布。如某一服务设施在一定时间内受到的服务请求的次数,电话交换机接到呼叫的次数、汽车站台的候客人数、机器出现的故障数、自然灾害发生的次数、DNA序列的变异数、放射性原子核的衰变数等等。

出自:http://www.360doc.com/content/14/0110/18/15459877_344179498.shtml

机器学习中的应用:

LDA的标准过程中单词出现的次数一般是由泊松分布来产生的。





泊松分布的来源—公式推导—应用相关推荐

  1. sklearn学习笔记(一)——数据预处理 sklearn.preprocessing

    python sklearn 更多 个人分类: Python 数据处理 sklearn 数据预处理 sklearn.preprocessing 查看全文 http://www.taodudu.cc/n ...

  2. python灰色模型代码_python 实现 灰色预测 GM(1,1)模型 灰色系统 预测 灰色预测公式推导...

    来源公式推导连接 关键词:灰色预测 python 实现 灰色预测 GM(1,1)模型 灰色系统 预测 灰色预测公式推导 一.前言 本文的目的是用Python和类对灰色预测进行封装 二.原理简述 1.灰 ...

  3. 二项分布、指数分布与泊松分布的关系

    1.泊松分布 由法国数学家西莫恩·德尼·泊松(Siméon-Denis Poisson)在1838年时发表: 若X服从参数为的泊松分布,记为X~P(), 泊松分布的概率分布函数: 参数λ是单位时间(或 ...

  4. 转载:概率与梳理统计||数学基础

    导言:本文从微积分相关概念,梳理到概率论与数理统计中的相关知识,但本文之压轴戏在本文第4节(彻底颠覆以前读书时大学课本灌输给你的观念,一探正态分布之神秘芳踪,知晓其前后发明历史由来),相信,每一个学过 ...

  5. 概率论与数理统计知识

    导言:本文从微积分相关概念,梳理到概率论与数理统计中的相关知识,但本文之压轴戏在本文第4节(彻底颠覆以前读书时大学课本灌输给你的观念,一探正态分布之神秘芳踪,知晓其前后发明历史由来),相信,每一个学过 ...

  6. 【转载】数据挖掘中所需的概率论与数理统计知识

    [转载]数据挖掘中所需的概率论与数理统计知识 (关键词:微积分.概率分布.期望.方差.协方差.数理统计简史.大数定律.中心极限定理.正态分布) https://blog.csdn.net/zbj366 ...

  7. 据挖掘中所需的概率论与数理统计知识

    据挖掘中所需的概率论与数理统计知识 ( 关键词:微积分.概率分布.期望.方差.协方差.数理统计简史.大数定律.中心极限定理.正态分布) 导言:本文从微积分相关概念,梳理到概率论与数理统计中的相关知识, ...

  8. 06 随机变量及其分布

    1.何谓随机变量 何谓随机变量?即给定样本空间(S,F),其上的实值函数X:S->R 称为(实值)随机变量. 如果随机变量X的取值是有限的或者是可数无穷尽的值,则称为离散随机变量(用白话说,此类 ...

  9. 机器学习中的数学基础 4

    随机变量与概率分布 均匀分布 每个事件的概率是一样的,例如骰子的六面,每一面的概率都是 1 / 6 1/6 1/6 随机变量 给定样本空间 ( S , F ) (S,{\mathbb {F}}) (S ...

最新文章

  1. 帝国cms微信小程序算命小程序开发之指纹算命实现方法
  2. Servlet--06--解决乱码问题; 请求转发; 重定向;
  3. NAS组建日记(一):来块大硬盘先—HGST 10TB NAS硬盘开箱小测
  4. mysql创建表时出现1071_mysql 出现1071错误怎么办
  5. struts2的namespace的问题
  6. WorldWind Java 版学习:1、启动过程
  7. 和华为杯_2019全国大学生物联网设计竞赛(华为杯)拉开序幕
  8. mybatis collection标签_MyBatis第二天(结果映射+动态sql+关联查询)
  9. HTTP代理服务器 - Apache httpd
  10. 基于微信小程序的外卖点餐系统
  11. MySQL数据库 单表数据记录查询
  12. uCos中的信号量机制
  13. 黑苹果驱动_黑苹果怎么更新驱动程序?
  14. 区块链项目_身份识别系统CryptID
  15. python3的基本数据类型_python3基本数据类型
  16. 神级:程序员面试、算法研究、编程艺术、红黑树、机器学习5大经典原创系列集锦与总结
  17. Micropython——关于I2C和SoftI2C以及SPI和SoftSPI的区别
  18. serverlet学习
  19. Tensorflow去掉warning
  20. CMOS与CCD的区别是什么?

热门文章

  1. element 验证详解 自定义验证规则
  2. html文字自动大小写,CSS中首字母大写如何实现
  3. mysql主从配置 ssl,MySQL配置SSL主从复制
  4. 重磅发布 |《2023年消费品企业数字化转型调研白皮书》
  5. RabbitMQ通过shovel插件迁移数据
  6. B站UP主指法芬芳张大仙评论可视化
  7. Vue路由无痕浏览 - nodeJs环境搭建
  8. 三舰护航,看懂球帝如何应对日增百万用户
  9. 偷偷爆料下各公司年终奖!(最新版)
  10. 拆分大科技公司到底意味着什么?