python如何计算概率事件_145、Python实现概率分布

一、概率分布

概率分布，是概率论的基本概念之一，主要用以表述随机变量取值的概率规律。为了使用的方便，根据随机变量所属类型的不同，概率分布取不同的表现形式。

概率分布包括离散概率分布和连续概率分布。

离散数据：数据由一个个单独的数值组成，其中的每一个数值都有相应概率。

连续数据：数据涵盖的是一个范围，这个范围内的任何一个数值都有可能成为事件的结果。

离散概率分布包括：伯努利分布、二项分布、几何分布、泊松分布

连续概率分布包括：正态分布、幂律分布

二、安装python的科学计算包scipy

在python的科学计算包scipy的stats模块计算出常见概率分布的概率值，并用matplotlib包进行绘图。

在notebook环境下安装科学计算包scipy。如果已安装忽略下面安装步骤。

安装步骤：

1)打开终端Anaconda Prompt

2)在conda中运行以下命令：conda install scipy

如果存在多个python环境，先进入想要的环境再安装，比如我自己设置了py2和py3两个环境，先在conda中进入python环境：activate py3，再按上面步骤2执行

如果还没有安装numpy包和matplotlib包，也按上述命令安装这些包

三、概率分布

1.离散概率分布：伯努利分布(Bernoulli Distribution)

伯努利分布亦称“零一分布”、“两点分布”，即事件的结果只有两个值，且事件之间相互独立，例如抛一次硬币就为一次伯努利试验，结果要么为正面要么为反面，因此它符合伯努利分布。伯努利试验只做一次。

伯努利试验的特点是：

(1)每次试验中事件只有两种结果：事件发生或者不发生，如硬币正面或反面，患病或没患病；

(2)每次试验中事件发生的概率是相同的，注意不一定是0.5；

(3)n次试验的事件相互之间独立。

公式为：

1.伯努利分布公式.jpg

期望与方差：

2.伯努利分布期望与公差.png

案例：玩抛硬币的游戏，只抛1次硬币，成功抛出正面朝上记录为1，反面朝上即抛硬币失败记录为0

思路：

3.思路.jpg

Python代码实现：

导入包并求出对应概率：

4.导入包.png

绘制伯努利分布：

5.绘制伯努利分布.png

2.离散概率分布：二项分布(Binomial Distribution)

二项分布就是重复n次独立的伯努利试验。在每次试验中只有两种可能的结果，而且事件相互独立，事件发生与否的概率在每一次独立试验中都保持不变。当试验次数为1时，二项分布服从0-1分布。它计算的结果是做n次试验发生某个结果的概率，例如：抛一次硬币正面朝上的概率，抛两次正面朝上，抛n次正面朝上的概率。

二项分布的特点是：

(1)是在进行一系列独立试验；

(2)每一次都存在成功或失败的可能，每一次试验的成功概率相同；

(3)试验次数有限。

如果事件发生的概率是P,则不发生的概率q=1-p，n表示试验次数，X和r表示n次试验中的成功次数，

公式为：

6.二项分布公式.png

期望与方差：

7.二项分布期望与方差.png

案例：继续玩抛硬币游戏，假如抛硬币5次，求抛出正面朝上次数的概率

Python代码实现：

求出二项分布概率：

8.求出二项分布概率.png

绘制二项分布：

9.绘制二项分布.png

3.离散概率分布：几何分布(Geometric Distribution)

几何分布就是在n次伯努利试验中，试验k次才得到第一次成功的机率。

几何分布的特点：

(1)进行一系列相互独立的试验；

(2)每一次试验既有成功的可能，也有失败的可能，且单次试验的成功概率相同；

(3)主要是为了取得第一次成功需要进行多少次试验。

公式为：

10.几何分布公式.png

期望与方差：

11.几何分布期望与方差.png

案例：向一个喜欢的女孩表白，会存在表白成功和不成功的可能，如果向这个女孩表白，直到表白成功为止，有可能表白1次、2次、3次，现在求首次表白成功的概率

Python代码实现：

求出几何分布概率：

12.求几何分布概率.png

绘制几何分布：

13.绘制几何分布.png

4.离散概率分布：泊松分布(Poisson Distribution)

泊松分布描述的是已知一段时间内事件发生的平均数，求某个时间内发生的概率。

泊松分布的特点：

(1)单独事件在给定区间内随机、独立地发生，给定区间可以是时间或空间；

(2)已知该区间内的事件平均发生次数(或叫做发生率)，且为有限数值。该事件平均发生次数通常用希腊字母λ(lambda)表示。

公式为：

14.泊松分布公式.png

期望与方差：

15.泊松分布期望与方差.png

其中，r表示给定区间内发生事件的次数；

λ表示每个区间内平均发生次数。

案例：已知某路口发生事故的比率是每天2次，那么在此处一天内发生k次事故的概率是多少？

Python代码实现：

求出泊松分布的概率：

16.求泊松分布的概率.png

绘制泊松分布：

17.绘制泊松分布.png

5.连续概率分布：正态分布(Normal Distribution)

正态分布(Normal distribution)，又名高斯分布(Gaussian distribution)，正态曲线呈钟型，两头低，中间高，左右对称，中央部位的概率密度最大。越偏离均值，其概率密度减小。

若随机变量X服从一个数学期望为μ、方差为σ2的正态分布，记为N(μ，σ2)。其概率密度函数为正态分布的期望值μ决定了其位置，其标准差σ决定了分布的幅度。当μ = 0,σ = 1时的正态分布是标准正态分布。

概率密度函数f(x)：通过它可以求出一个数据范围内的某个连续变量的概率，可以指出该概率分布的形状。

概率密度：通过面积指出各种范围内的概率大小，通过概率密度函数进行描述。

求解正态分布概率步骤：

(1)确定分布和范围，即算出均值和标准差；

(2)将分布标准化，求出标准分；

18.标准分.png

(3)查找概率，通过在概率表中查找标准分可以求出正态概率，概率表给出的是等于或小于这个数值的概率。

Python代码实现：

定义正态分布随机变量：

19.定义正态分布随机变量.png

求出概率密度函数并绘图：

20.求出概率密度函数并绘图.png

源码：

# coding: utf-8

# # 1.离散概率分布：伯努利分布(Bernoulli Distribution)

# 案例：玩抛硬币的游戏，只抛1次硬币，成功抛出正面朝上记录为1，反面朝上即抛硬币失败记录为0

# In[1]:

# 导入包

import numpy as np

import matplotlib.pyplot as plt

# 统计计算包的统计模块

from scipy import stats

# In[2]:

'''

第1步，定义随机变量：1次抛硬币

正面朝上记录为1，反面朝上记录为0

'''

# arange用于生成一个等差数组，arange([start, ]stop, [step, ]

X1 = np.arange(0,2,1)

# In[3]:

'''

第2步，求对应分布的概率：概率质量函数(PMF)

返回一个列表，列表中每个元素表示随机变量中对应值的概率

'''

p1 = 0.5 # 硬币朝上的概率

pList1 = stats.bernoulli.pmf(X1,p1)

pList1

# In[4]:

'''

第3步，绘图

plot默认绘制折线

marker：点的形状，值o表示点为圆圈标记(circle marker)

linestyle：线条的形状，值None表示不显示连接各个点的折线

'''

plt.plot(X1,pList1,marker='o',linestyle='None')

'''

vlines用于绘制竖直线(vertical lines),

参数说明：vline(x坐标值, y坐标最小值, y坐标值最大值)

我们传入的X是一个数组，是给数组中的每个x坐标值绘制竖直线，

竖直线y坐标最小值是0，y坐标值最大值是对应pList1中的值

'''

plt.vlines(X1,0,pList1)

plt.xlabel('随机变量：抛1次硬币')

plt.ylabel('概率')

plt.title('伯努利分布：p=%.2f' % p1)

plt.show()

# # 2.离散概率分布：二项分布(Binomial Distribution)

# 案例：继续玩抛硬币游戏，假如抛硬币5次，求抛出正面朝上次数的概率

# In[5]:

# 第1步，定义随机变量：5次抛硬币，正面朝上的次数

n2 = 5 # 做某件事情的次数

p2 = 0.5 # 做某件事情成功的概率(抛硬币正面朝上的概率)

X2 = np.arange(0,n2+1,1) # 做某件事成功的次数(抛硬币正面朝上的次数)

# In[6]:

# 第2步，求对应分布的概率：概率质量函数(PMF)

# 返回一个列表，列表中每个元素表示随机变量中对应值的概率

pList2 = stats.binom.pmf(X2,n2,p2)

pList2

# In[7]:

'''

第3步，绘图

plot默认绘制折线

marker：点的形状，值o表示点为圆圈标记(circle marker)

linestyle：线条的形状，值None表示不显示连接各个点的折线

'''

plt.plot(X2,pList2,marker='o',linestyle='None')

'''

vlines用于绘制竖直线(vertical lines),

参数说明：vline(x坐标值, y坐标最小值, y坐标值最大值)

我们传入的X是一个数组，是给数组中的每个x坐标值绘制竖直线，

竖直线y坐标最小值是0，y坐标值最大值是对应pList2中的值

'''

plt.vlines(X2,0,pList2)

plt.xlabel('随机变量：抛硬币正面朝上的次数')

plt.ylabel('概率')

plt.title('二项分布：n=%i,p=%.2f' % (n2,p2))

plt.show()

# # 3.离散概率分布：几何分布(Geometric Distribution)

# 案例：向一个喜欢的女孩表白，会存在表白成功和不成功的可能，如果向这个女孩表白，直到表白成功为止，有可能表白1次、2次、3次，现在求首次表白成功的概率

# In[8]:

'''

第1步，定义随机变量：

首次表白成功的次数，可能是1次，2次，3次

'''

# 第k次做某件事，才取得第1次成功

# 这里我们想知道5次表白成功的概率

k = 5

# p3表示做某件事成功的概率，这里假设每次表白成功的概率为60%

p3 = 0.6

X3 = np.arange(1,k+1,1)

# In[9]:

'''

第2步，求对应分布的概率：概率质量函数(PMF)

返回一个列表，列表中每个元素表示随机变量中对应值的概率

分别表示第1次表白成功的概率，第2次表白成功的概率一直到第5次表白成功的概率

'''

pList3 = stats.geom.pmf(X3,p3)

pList3

# In[10]:

'''

第3步，绘图

plot默认绘制折线

marker：点的形状，值o表示点为圆圈标记(circle marker)

linestyle：线条的形状，值None表示不显示连接各个点的折线

vlines用于绘制竖直线(vertical lines),

参数说明：vline(x坐标值, y坐标最小值, y坐标值最大值)

我们传入的X是一个数组，是给数组中的每个x坐标值绘制竖直线，

竖直线y坐标最小值是0，y坐标值最大值是对应pList中的值

'''

plt.plot(X3,pList3,marker='o',linestyle='None')

plt.vlines(X3,0,pList3)

plt.xlabel('随机变量：表白第k次才首次成功')

plt.ylabel('概率')

plt.title('几何分布：p=%.2f' % p3)

plt.show()

# # 4.离散概率分布：泊松分布(Poisson Distribution)

# 案例：已知某路口发生事故的比率是每天2次，那么在此处一天内发生k次事故的概率是多少？

# In[11]:

# 第1 步，定义随机变量

mu4 = 2 # 平均值：每天发生2次事故

k4 = 4 # 次数，现在想知道每天发生4次事故的概率

# 发生事故次数，包含0次，1次，2次，3次，4次事故

X4 = np.arange(0,k4+1,1)

# In[12]:

'''

第2步，求对应分布的概率：概率质量函数(PMF)

返回一个列表，列表中每个元素表示随机变量中对应值的概率

分别表示发生0次，1次，2次，3次，4次事故的概率

'''

pList4 = stats.poisson.pmf(X4,mu4)

pList4

# In[13]:

# 第3步，绘图

plt.plot(X4,pList4,marker='o',linestyle='None')

plt.vlines(X4,0,pList4)

plt.xlabel('某路口发生k次事故')

plt.ylabel('概率')

plt.title('泊松分布：平均值mu=%i' % mu4 )

plt.show()

# # 5.连续概率分布：正态分布(Normal Distribution)

# In[14]:

# 第1步，定义随机变量

mu5 = 0 # 平均值

sigma = 1 # 标准差

X5 = np.arange(-5,5,0.1)

# In[15]:

# 第2步，求概率密度函数(PDF)

y = stats.norm.pdf(X5,mu5,sigma)

# In[16]:

# 第3步，绘图

plt.plot(X5,y)

plt.xlabel('随机变量：x')

plt.ylabel('概率：y')

plt.title('正态分布：$\mu$=%.1f,$\sigma^2$=%.1f' % (mu5,sigma))

plt.grid()

plt.show()

python如何计算概率事件_145、Python实现概率分布相关推荐

python如何计算概率事件_Python实现的概率分布运算操作示例
本文实例讲述了Python实现的概率分布运算操作.分享给大家供大家参考,具体如下: 1. 二项分布(离散) import numpy as np from scipy import stats imp ...
python如何计算概率事件_怎样用Python实现统计、概率、机器学习基础实验？一文看懂...
导读:概率论与统计学是机器学习的基础,但很多初学者不太了解它们.本文介绍了概率及统计的基本概念.联系以及用法,并以正态分布为例展示了什么是概率分布.分布函数以及经验法则.同样本文还概念性地解释了中心极 ...
python如何计算概率事件_「条件概率公式」scikit-learn机器学习（五）--条件概率，全概率和贝叶斯定理及python实现 - seo实验室...
条件概率公式在理解贝叶斯之前需要先了解一下条件概率和全概率,这样才能更好地理解贝叶斯定理一丶条件概率条件概率定义:已知事件A发生的条件下,另一个事件B发生的概率成为条件概率,即为P(B|A) 如 ...
python绘制概率密度曲线_[python常用图件绘制#04]核密度曲线图（峰值点显示）
一.关于核密度估计带宽的一些说明进行核密度估计Kernel Density Estimation(KDE)时,带宽bw的选取尤为重要,不同的带宽会对结果造成很大的影响.利用seaborn库中kdep ...
python如何计算个人gpa_【Python】计算GPA | 学步园
最近开始我的研究生生涯了,周围都在谈论GPA这种高深的东西,像我这种工科学校背景的孩子一向是个喜欢在键盘上耕耘的人,对考高分没有多大兴趣(其实是没有那个本事).不过我也想知道我自己本科的GPA是多少来 ...
python如何计算个人gpa_GPA计算Python
我一直收到一个错误,这个GPA计算器,应该计算你的GPA基于4个年级.此外,程序需要终止,每当一个字母没有命名为a,B,C,D,F被输入,我不知道如何做.def GetName(): name = r ...
python区间分布统计_常见概率统计分布及Python实现
一.离散随机变量及连续随机变量随机变量 1. 离散随机变量(Discrete random variable):取值是可数个值(且只能为自然数0.1.2...)的随机变量 2. 连续随机变量(Con ...
python按概率生成随机数
Talk is cheap, show me the code. random_demo.py代码如下: # coding: utf-8 import randomdef random_index(r ...
python线程监控配置文件_一日一技：Python多线程的事件监控
一日一技:Python多线程的事件监控设想这样一个场景: 你创建了10个子线程,每个子线程分别爬一个网站,一开始所有子线程都是阻塞等待.一旦某个事件发生:例如有人在网页上点了一个按钮,或者某人在命令 ...

python如何计算概率事件_145、Python实现概率分布

python如何计算概率事件_145、Python实现概率分布相关推荐

最新文章

热门文章