Probability Distributions play an important role in our daily lives. We commonly use them when trying to summarise and gain insights from different forms of data.

概率分布在我们的日常生活中起着重要作用。 在尝试总结不同形式的数据并从中获取见解时,我们通常使用它们。

Because of this, they're quite an important topic in fields such as Mathematics, Computer Science, Statistics, and Data Science.

因此,它们是数学,计算机科学,统计和数据科学等领域的重要主题。

There are two main types of data: Numerical (for example integers and floats), and Categorical (for example strings of text).

数据有两种主要类型: 数值 (例如整数和浮点数)和分类 (例如文本字符串)。

Numerical data can also be in either of two forms:

数值数据也可以采用以下两种形式之一:

  • Discrete: this form of data can just take a limited number of values (like the number of clothes we have). We can infer probability mass functions from discrete data.

    离散的:这种形式的数据只能接受有限数量的值(例如我们拥有的衣服数量)。 我们可以从离散数据推断概率质量函数。

  • Continuous: on the other hand, continuous data is used to describe more abstract concepts such as weight/distance which can take any fractional or real value. From continuous data we can instead infer probability density functions.

    连续的:另一方面,连续的数据用于描述更抽象的概念,例如权重/距离,它可以取任何分数或实数值。 我们可以从连续数据中推断出概率密度函数。

Probability mass functions can give us the probability that a variable is equal to a certain value. On the other hand, the values of probability density functions do not represent probabilities on their own, but instead first need to be integrated (within the considered range).

概率质量函数可以为我们提供变量等于某个值的概率。 另一方面,概率密度函数的值本身并不表示概率,而是首先需要积分(在所考虑的范围内)。

什么是泊松分布? (What is a Poisson Distribution?)

Poisson Distributions are commonly used for two main purposes:

泊松分布通常用于两个主要目的:

  • Predicting how many times an event will take place within a chosen time period. This technique can be used for different risk analysis applications such as house insurance price estimation.预测事件在选定时间段内将发生多少次。 该技术可用于不同的风险分析应用,例如房屋保险价格估计。
  • Estimating a probability that an event might occur given how often it happened in the past (for example how likely it is that there will be a power-cut in the next two months). 考虑到事件过去发生的频率,估计事件发生的可能性(例如,未来两个月停电的可能性有多大)。

Poisson Distributions let us be confident of the average time between the occurrence of different events. They can't, however, tell us the precise moment an event might take place (since processes usually have stochastic behaviour).

泊松分布使我们对不同事件发生之间的平均时间充满信心。 但是,他们无法告诉我们事件可能发生的确切时间(因为流程通常具有随机行为)。

线性与非线性系统 (Linear vs non-linear systems)

Natural systems can, in fact, be divided into two main categories: linear and non-linear (stochastic).

实际上,自然系统可以分为两大类: 线性非线性(随机)

In linear systems, causes always precede their effect which creates a strong time precedence effect.

在线性系统中,原因总是先于其结果,从而产生很强的时间优先效应。

But this doesn't instead hold true when talking about non-linear systems, as small changes in the system's initial conditions can lead to unpredictable outcomes.

但这在谈论非线性系统时并不能成立,因为系统初始条件的微小变化会导致不可预测的结果。

Considering how complex and chaotic our real world is, most processes are better described using non-linear systems, although linear approximations are sometimes possible.

考虑到我们现实世界的复杂性和混乱性,使用非线性系统可以更好地描述大多数过程,尽管有时可以进行线性近似。

Poisson Distributions can be modeled using the expression in the figure below, where λ is used to represent the expected number of events which can take place in the considered time-span.

可以使用下图中的表达式对泊松分布建模,其中λ用于 表示在考虑的时间跨度内可能发生的预期事件数。

The main characteristics which describe Poisson Processes are:

描述泊松过程的主要特征是:

  1. Two events can't take place simultaneously.两个事件不能同时发生。
  2. The average rate between event occurrence is overall constant.事件发生之间的平均速率总体恒定。
  3. Events are independent of each other (if one happens, this does not have any influence on the probability that another event might take place).事件彼此独立(如果一个事件发生,则不会对另一事件发生的可能性产生任何影响)。
  4. Events can take place any number of times (within the considered time-span).事件可以发生任意次(在所考虑的时间跨度内)。

泊松分布的一个例子 (An example of a Poisson Distribution)

In the figure below, you can see how varying the expected number of events (λ) which can take place in a period can change a Poisson Distribution. The image below has been simulated, making use of this Python code:

在下图中,您可以看到改变一个时期内可能发生的事件数(λ)如何改变泊松分布。 下面的图像已使用此Python代码进行了模拟:

import numpy as np
import matplotlib.pyplot as plt
import scipy.stats as stats# n = number of events, lambd = expected number of events
# which can take place in a period
for lambd in range(2, 12, 2):n = np.arange(0, 9)poisson = stats.poisson.pmf(n, lambd)plt.plot(n, poisson, '-o', label="λ = {:f}".format(lambd))plt.xlabel('Number of Events', fontsize=12)plt.ylabel('Probability', fontsize=12)plt.title("Poisson Distribution varying λ")plt.legend()plt.savefig('name.png')

Taking a closer look to this simulation, we can discover the following patterns:

仔细研究此模拟,我们可以发现以下模式:

  • In each of the different cases, the number assigned to λ corresponds to the peak of the distribution, which then trails off moving further away from the peak. 在每种不同情况下,分配给λ的数字对应于分布的峰值,然后逐渐远离峰值。
  • The more events that are expected to take place during the simulation, the greater the expected area under the distribution curve will be.在模拟过程中预期发生的事件越多,分布曲线下的预期面积将越大。

This type of simulation could, for example, be used to try to reduce the queuing time when going shopping to a supermarket.

例如,可以使用这种类型的模拟来尝试减少去超市购物时的排队时间。

The owner could create a record of how many customers visit the store at different times and on different days of the week in order to then fit this data to a Poisson Distribution.

所有者可以创建一个记录,记录有多少顾客在一周的不同时间和一周中的不同日期访问该商店,然后将该数据拟合到泊松分布中。

In this way, it would be much easier to determine how many cashiers should be working at different times of the day/week in order to enhance the customer experience.

这样,确定一天/一周的不同时间应有多少个收银员工作以提高客户体验会容易得多。

结语 (Wrapping up)

In case you are interested in learning more about the applications of distributions in stochastic settings, more information is available here.

如果您有兴趣了解更多有关随机环境中分布的应用的信息,请在此处获取更多信息。

I hope you enjoyed this article, thank you for reading!

希望您喜欢这篇文章,感谢您的阅读!

联络我 (Contact me)

If you want to keep updated with my latest articles and projects follow me on Medium and subscribe to my mailing list. These are some of my contacts details:

如果您想随时了解我的最新文章和项目,请在Medium上关注我,并订阅我的邮件列表 。 这些是我的一些联系方式:

  • Linkedin

    领英

  • Personal Blog

    个人博客

  • Personal Website

    个人网站

  • Patreon

    Patreon

  • Medium Profile

    中档

  • GitHub

    的GitHub

  • Kaggle

    卡格勒

翻译自: https://www.freecodecamp.org/news/poisson-distribution-a-formula-to-calculate-probability-distribution/

泊松分布–计算概率分布的公式相关推荐

  1. 定积分计算器_使用科学计算器计算概率分布

    [作者声明] 本文所有文字均为作者原创,所有图片均为作者本人亲自拍摄或制作. 版权所有,仅供阅读欣赏,禁止任何单位或个人以任何形式对本文的文字或图片进行包括但不限于复制.转载.引用.抄袭.截图.模仿. ...

  2. 泊松分布如何用计算机计算,如何利用泊松分布计算概率

    1.泊松概率分布 许多研究都是基于对每概率区域中不一致或缺陷数目的计算.一个概率区域是关于时间.容量的连续单元,或者是其中超过一个事件可能发生的这样的区域.这样的例子包括一台新电冰箱表面的缺陷.一家旅 ...

  3. n维椭球体积公式_混凝土工程量计算规则及公式

    ▶下载微试验APP ▶发布招聘 点击进入"微试验_视频课件+题库复习+模拟考试"学习 混凝土垫层工程量计算规则及公式 1.条形基础砼垫层计算公式  外墙条基砼垫层体积=外墙条形基础 ...

  4. excel函数公式html文档,Excel中把计算式转换为运算结果的方法 EXCEL中计算出的公式如何转换成纯文本内容?...

    如何在EXCEL中将计算公式直接变结果如我在A1输入计算式:(1+2*3+4/5-6)*1.2+(1+5) 如何在B1得出该计算式的选中B1然后按快捷键ctrl+F3,进入名称管理器,新建,输入任意名 ...

  5. python利用近似公式计算π_Excel函数公式大全之利用SUMSQ函数快速计算多个数据的平方和...

    各位Excel天天学的小伙伴们大家好,欢迎收看Excel天天学出品的excel2019函数公式大全课程.今天我们要学习的函数是数学函数中的SUMSQ函数,SUMSQ函数的功能是快速计算多个数据的平方和 ...

  6. C语言:输入一个华氏温度f,计算并输出对应的摄氏温度。计算摄氏温度的公式为:c=5/9*(f-32),输出取两位小数。

    /*输入一个华氏温度f,计算并输出对应的摄氏温度.计算摄氏温度的公式为:c=5/9*(f-32),输出取两位小数.*/#include <stdio.h> #include <con ...

  7. 计算机利用公式计算实发工资怎么弄,如何在excel 表中 添加税收计算程序?excle中计算税收的公式...

    Excel新个税的计算公式 =ROUND(MAX((A2-5000)*{0.03;0.1;0.2;0.25;0.3;0.35;0.45}-{0;210;1410;2660;4410;7160;1516 ...

  8. 计算时间差 html,计算时间差的公式

    EXCEL中有没有计算时间差的公式. 如8-15 8:00,8-16 17:49之间的时间差 A1输入 8-15 8:00 B1输入 8-16 17:49 C1单元格输入公式 =TEXT(B1-A1, ...

  9. Excel输入公式计算只显示公式不出结果

    问题描述: Excel输入公式计算只显示公式不出结果 产生原因: Excel设置是显示公式,因此不会出现计算结果 也有人说是因为单元格格式为文本格式所以不出结果,但是经过本人测试,在上述公式的形式下无 ...

  10. 已知计算组合的公式如下,用递归算法写出一个计算组合Cmn的值的函数zh(m,n),并写出主函数调用该函数。

    /* 已知计算组合数的公式如下,用递归算法写出一个计算组合Cmn的值的函数zh(m,n),并写出主函数调用该函数. 输入 两个整数 m,n(m>=n)输出 组合值样例输入 4 2 样例输出 6 ...

最新文章

  1. 转 LIST INCARNATION OF DATABASE
  2. Android内存分析和调优
  3. 星云精准测试之用例魔方
  4. NSTimeInterval和CMTime
  5. python使用proxy
  6. 组态王opc_组态王和西门子S7300、S7400系列PLC通讯的几种配置方案
  7. [asp.net控件]asp.net页面传值汇总
  8. matlab 倒位序fft程序,[转载]MATLAB的一个FFT程序
  9. 永久免费的pdf编辑器
  10. 802.11/wlan/wifi/无线相关学习资料整理
  11. 用c语言输出英文字母表音标,26个英文字母表中文
  12. 【转】会议中控系统在智能化会议室的应用
  13. 传统数据与大数据对比
  14. 《创造成功本能》 博客思听 2011年2月
  15. 商城小程序通过交易组件实现直播带货
  16. 硬核!江西一社区干部用无人机给居民量体温:1米内测量误差仅1%
  17. 《程序员练习生》第5期 学习编程的乐趣
  18. IMX6Q安卓解开温度墙,设置高性能模式
  19. NAT模式/路由模式/全路由模式
  20. RISC-V Assembler Modifiers

热门文章

  1. 英文字母pc是什么意思,互联网的pc指的是什么
  2. 15.正则表达式扩展正则字符处理
  3. 人工智能时代已经到来,政务工业商业等各领域都将是刚需
  4. Windows Server安装 IIS 时报错:刷新服务器管理器时出现意外错 误:无法打开匿名级安全令牌。(异常来自 HRESULT:0x80070543)
  5. 以新发展理念引领新型智慧城市建设
  6. python operator用法,Python operator.eq()函数与示例
  7. ASP站内搜索代码#
  8. 无所不能的NumPy:我用它弹奏出了CD音质的吉他名曲“爱的罗曼史”
  9. android控件Recy,Android RecyclerView控件的使用
  10. 一个计算机网络的物理组成,1.1.2.1 计算机网络物理组成