一、概率分布

概率分布,是概率论的基本概念之一,主要用以表述随机变量取值的概率规律。为了使用的方便,根据随机变量所属类型的不同,概率分布取不同的表现形式。

概率分布包括离散概率分布和连续概率分布。

离散数据:数据由一个个单独的数值组成,其中的每一个数值都有相应概率。

连续数据:数据涵盖的是一个范围,这个范围内的任何一个数值都有可能成为事件的结果。

离散概率分布包括:伯努利分布、二项分布、几何分布、泊松分布

连续概率分布包括:正态分布、幂律分布

二、安装python的科学计算包scipy

在python的科学计算包scipy的stats模块计算出常见概率分布的概率值,并用matplotlib包进行绘图。

在notebook环境下安装科学计算包scipy。如果已安装忽略下面安装步骤。

安装步骤:

1)打开终端Anaconda Prompt

2)在conda中运行以下命令:conda install scipy

如果存在多个python环境,先进入想要的环境再安装,比如我自己设置了py2和py3两个环境,先在conda中进入python环境:activate py3,再按上面步骤2执行

如果还没有安装numpy包和matplotlib包,也按上述命令安装这些包

三、概率分布

1.离散概率分布:伯努利分布(Bernoulli Distribution)

伯努利分布亦称“零一分布”、“两点分布”,即事件的结果只有两个值,且事件之间相互独立,例如抛一次硬币就为一次伯努利试验,结果要么为正面要么为反面,因此它符合伯努利分布。伯努利试验只做一次。

伯努利试验的特点是:

(1)每次试验中事件只有两种结果:事件发生或者不发生,如硬币正面或反面,患病或没患病;

(2)每次试验中事件发生的概率是相同的,注意不一定是0.5;

(3)n次试验的事件相互之间独立。

公式为:

1.伯努利分布公式.jpg

期望与方差:

2.伯努利分布期望与公差.png

案例:玩抛硬币的游戏,只抛1次硬币,成功抛出正面朝上记录为1,反面朝上即抛硬币失败记录为0

思路:

3.思路.jpg

Python代码实现:

导入包并求出对应概率:

4.导入包.png

绘制伯努利分布:

5.绘制伯努利分布.png

2.离散概率分布:二项分布(Binomial Distribution)

二项分布就是重复n次独立的伯努利试验。在每次试验中只有两种可能的结果,而且事件相互独立,事件发生与否的概率在每一次独立试验中都保持不变。当试验次数为1时,二项分布服从0-1分布。它计算的结果是做n次试验发生某个结果的概率,例如:抛一次硬币正面朝上的概率,抛两次正面朝上,抛n次正面朝上的概率。

二项分布的特点是:

(1)是在进行一系列独立试验;

(2)每一次都存在成功或失败的可能,每一次试验的成功概率相同;

(3)试验次数有限。

如果事件发生的概率是P,则不发生的概率q=1-p,n表示试验次数,X和r表示n次试验中的成功次数,

公式为:

6.二项分布公式.png

期望与方差:

7.二项分布期望与方差.png

案例:继续玩抛硬币游戏,假如抛硬币5次,求抛出正面朝上次数的概率

Python代码实现:

求出二项分布概率:

8.求出二项分布概率.png

绘制二项分布:

9.绘制二项分布.png

3.离散概率分布:几何分布(Geometric Distribution)

几何分布就是在n次伯努利试验中,试验k次才得到第一次成功的机率。

几何分布的特点:

(1)进行一系列相互独立的试验;

(2)每一次试验既有成功的可能,也有失败的可能,且单次试验的成功概率相同;

(3)主要是为了取得第一次成功需要进行多少次试验。

公式为:

10.几何分布公式.png

期望与方差:

11.几何分布期望与方差.png

案例:向一个喜欢的女孩表白,会存在表白成功和不成功的可能,如果向这个女孩表白,直到表白成功为止,有可能表白1次、2次、3次,现在求首次表白成功的概率

Python代码实现:

求出几何分布概率:

12.求几何分布概率.png

绘制几何分布:

13.绘制几何分布.png

4.离散概率分布:泊松分布(Poisson Distribution)

泊松分布描述的是已知一段时间内事件发生的平均数,求某个时间内发生的概率。

泊松分布的特点:

(1)单独事件在给定区间内随机、独立地发生,给定区间可以是时间或空间;

(2)已知该区间内的事件平均发生次数(或叫做发生率),且为有限数值。该事件平均发生次数通常用希腊字母λ(lambda)表示。

公式为:

14.泊松分布公式.png

期望与方差:

15.泊松分布期望与方差.png

其中,r表示给定区间内发生事件的次数;

λ表示每个区间内平均发生次数。

案例:已知某路口发生事故的比率是每天2次,那么在此处一天内发生k次事故的概率是多少?

Python代码实现:

求出泊松分布的概率:

16.求泊松分布的概率.png

绘制泊松分布:

17.绘制泊松分布.png

5.连续概率分布:正态分布(Normal Distribution)

正态分布(Normal distribution),又名高斯分布(Gaussian distribution),正态曲线呈钟型,两头低,中间高,左右对称,中央部位的概率密度最大。越偏离均值,其概率密度减小。

若随机变量X服从一个数学期望为μ、方差为σ2的正态分布,记为N(μ,σ2)。其概率密度函数为正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。当μ = 0,σ = 1时的正态分布是标准正态分布。

概率密度函数f(x):通过它可以求出一个数据范围内的某个连续变量的概率,可以指出该概率分布的形状。

概率密度:通过面积指出各种范围内的概率大小,通过概率密度函数进行描述。

求解正态分布概率步骤:

(1)确定分布和范围,即算出均值和标准差;

(2)将分布标准化,求出标准分;

18.标准分.png

(3)查找概率,通过在概率表中查找标准分可以求出正态概率,概率表给出的是等于或小于这个数值的概率。

Python代码实现:

定义正态分布随机变量:

19.定义正态分布随机变量.png

求出概率密度函数并绘图:

20.求出概率密度函数并绘图.png

源码:

# coding: utf-8

# # 1.离散概率分布:伯努利分布(Bernoulli Distribution)

# 案例:玩抛硬币的游戏,只抛1次硬币,成功抛出正面朝上记录为1,反面朝上即抛硬币失败记录为0

# In[1]:

# 导入包

import numpy as np

import matplotlib.pyplot as plt

# 统计计算包的统计模块

from scipy import stats

# In[2]:

'''

第1步,定义随机变量:1次抛硬币

正面朝上记录为1,反面朝上记录为0

'''

# arange用于生成一个等差数组,arange([start, ]stop, [step, ]

X1 = np.arange(0,2,1)

X1

# In[3]:

'''

第2步,求对应分布的概率:概率质量函数(PMF)

返回一个列表,列表中每个元素表示随机变量中对应值的概率

'''

p1 = 0.5 # 硬币朝上的概率

pList1 = stats.bernoulli.pmf(X1,p1)

pList1

# In[4]:

'''

第3步,绘图

plot默认绘制折线

marker:点的形状,值o表示点为圆圈标记(circle marker)

linestyle:线条的形状,值None表示不显示连接各个点的折线

'''

plt.plot(X1,pList1,marker='o',linestyle='None')

'''

vlines用于绘制竖直线(vertical lines),

参数说明:vline(x坐标值, y坐标最小值, y坐标值最大值)

我们传入的X是一个数组,是给数组中的每个x坐标值绘制竖直线,

竖直线y坐标最小值是0,y坐标值最大值是对应pList1中的值

'''

plt.vlines(X1,0,pList1)

plt.xlabel('随机变量:抛1次硬币')

plt.ylabel('概率')

plt.title('伯努利分布:p=%.2f' % p1)

plt.show()

# # 2.离散概率分布:二项分布(Binomial Distribution)

# 案例:继续玩抛硬币游戏,假如抛硬币5次,求抛出正面朝上次数的概率

# In[5]:

# 第1步,定义随机变量:5次抛硬币,正面朝上的次数

n2 = 5 # 做某件事情的次数

p2 = 0.5 # 做某件事情成功的概率(抛硬币正面朝上的概率)

X2 = np.arange(0,n2+1,1) # 做某件事成功的次数(抛硬币正面朝上的次数)

X2

# In[6]:

# 第2步,求对应分布的概率:概率质量函数(PMF)

# 返回一个列表,列表中每个元素表示随机变量中对应值的概率

pList2 = stats.binom.pmf(X2,n2,p2)

pList2

# In[7]:

'''

第3步,绘图

plot默认绘制折线

marker:点的形状,值o表示点为圆圈标记(circle marker)

linestyle:线条的形状,值None表示不显示连接各个点的折线

'''

plt.plot(X2,pList2,marker='o',linestyle='None')

'''

vlines用于绘制竖直线(vertical lines),

参数说明:vline(x坐标值, y坐标最小值, y坐标值最大值)

我们传入的X是一个数组,是给数组中的每个x坐标值绘制竖直线,

竖直线y坐标最小值是0,y坐标值最大值是对应pList2中的值

'''

plt.vlines(X2,0,pList2)

plt.xlabel('随机变量:抛硬币正面朝上的次数')

plt.ylabel('概率')

plt.title('二项分布:n=%i,p=%.2f' % (n2,p2))

plt.show()

# # 3.离散概率分布:几何分布(Geometric Distribution)

# 案例:向一个喜欢的女孩表白,会存在表白成功和不成功的可能,如果向这个女孩表白,直到表白成功为止,有可能表白1次、2次、3次,现在求首次表白成功的概率

# In[8]:

'''

第1步,定义随机变量:

首次表白成功的次数,可能是1次,2次,3次

'''

# 第k次做某件事,才取得第1次成功

# 这里我们想知道5次表白成功的概率

k = 5

# p3表示做某件事成功的概率,这里假设每次表白成功的概率为60%

p3 = 0.6

X3 = np.arange(1,k+1,1)

X3

# In[9]:

'''

第2步,求对应分布的概率:概率质量函数(PMF)

返回一个列表,列表中每个元素表示随机变量中对应值的概率

分别表示第1次表白成功的概率,第2次表白成功的概率一直到第5次表白成功的概率

'''

pList3 = stats.geom.pmf(X3,p3)

pList3

# In[10]:

'''

第3步,绘图

plot默认绘制折线

marker:点的形状,值o表示点为圆圈标记(circle marker)

linestyle:线条的形状,值None表示不显示连接各个点的折线

vlines用于绘制竖直线(vertical lines),

参数说明:vline(x坐标值, y坐标最小值, y坐标值最大值)

我们传入的X是一个数组,是给数组中的每个x坐标值绘制竖直线,

竖直线y坐标最小值是0,y坐标值最大值是对应pList中的值

'''

plt.plot(X3,pList3,marker='o',linestyle='None')

plt.vlines(X3,0,pList3)

plt.xlabel('随机变量:表白第k次才首次成功')

plt.ylabel('概率')

plt.title('几何分布:p=%.2f' % p3)

plt.show()

# # 4.离散概率分布:泊松分布(Poisson Distribution)

# 案例:已知某路口发生事故的比率是每天2次,那么在此处一天内发生k次事故的概率是多少?

# In[11]:

# 第1 步,定义随机变量

mu4 = 2 # 平均值:每天发生2次事故

k4 = 4 # 次数,现在想知道每天发生4次事故的概率

# 发生事故次数,包含0次,1次,2次,3次,4次事故

X4 = np.arange(0,k4+1,1)

X4

# In[12]:

'''

第2步,求对应分布的概率:概率质量函数(PMF)

返回一个列表,列表中每个元素表示随机变量中对应值的概率

分别表示发生0次,1次,2次,3次,4次事故的概率

'''

pList4 = stats.poisson.pmf(X4,mu4)

pList4

# In[13]:

# 第3步,绘图

plt.plot(X4,pList4,marker='o',linestyle='None')

plt.vlines(X4,0,pList4)

plt.xlabel('某路口发生k次事故')

plt.ylabel('概率')

plt.title('泊松分布:平均值mu=%i' % mu4 )

plt.show()

# # 5.连续概率分布:正态分布(Normal Distribution)

# In[14]:

# 第1步,定义随机变量

mu5 = 0 # 平均值

sigma = 1 # 标准差

X5 = np.arange(-5,5,0.1)

X5

# In[15]:

# 第2步,求概率密度函数(PDF)

y = stats.norm.pdf(X5,mu5,sigma)

# In[16]:

# 第3步,绘图

plt.plot(X5,y)

plt.xlabel('随机变量:x')

plt.ylabel('概率:y')

plt.title('正态分布:$\mu$=%.1f,$\sigma^2$=%.1f' % (mu5,sigma))

plt.grid()

plt.show()

python如何计算概率事件_145、Python实现概率分布相关推荐

  1. python如何计算概率事件_Python实现的概率分布运算操作示例

    本文实例讲述了Python实现的概率分布运算操作.分享给大家供大家参考,具体如下: 1. 二项分布(离散) import numpy as np from scipy import stats imp ...

  2. python如何计算概率事件_怎样用Python实现统计、概率、机器学习基础实验?一文看懂...

    导读:概率论与统计学是机器学习的基础,但很多初学者不太了解它们.本文介绍了概率及统计的基本概念.联系以及用法,并以正态分布为例展示了什么是概率分布.分布函数以及经验法则.同样本文还概念性地解释了中心极 ...

  3. python如何计算概率事件_「条件概率公式」scikit-learn机器学习(五)--条件概率,全概率和贝叶斯定理及python实现 - seo实验室...

    条件概率公式 在理解贝叶斯之前需要先了解一下条件概率和全概率,这样才能更好地理解贝叶斯定理 一丶条件概率 条件概率定义:已知事件A发生的条件下,另一个事件B发生的概率成为条件概率,即为P(B|A) 如 ...

  4. python绘制概率密度曲线_[python常用图件绘制#04]核密度曲线图(峰值点显示)

    一.关于核密度估计带宽的一些说明 进行核密度估计Kernel Density Estimation(KDE)时,带宽bw的选取尤为重要,不同的带宽会对结果造成很大的影响.利用seaborn库中kdep ...

  5. python如何计算个人gpa_【Python】计算GPA | 学步园

    最近开始我的研究生生涯了,周围都在谈论GPA这种高深的东西,像我这种工科学校背景的孩子一向是个喜欢在键盘上耕耘的人,对考高分没有多大兴趣(其实是没有那个本事).不过我也想知道我自己本科的GPA是多少来 ...

  6. python如何计算个人gpa_GPA计算Python

    我一直收到一个错误,这个GPA计算器,应该计算你的GPA基于4个年级.此外,程序需要终止,每当一个字母没有命名为a,B,C,D,F被输入,我不知道如何做.def GetName(): name = r ...

  7. python区间分布统计_常见概率统计分布及Python实现

    一.离散随机变量及连续随机变量 随机变量 1. 离散随机变量(Discrete random variable):取值是可数个值(且只能为自然数0.1.2...)的随机变量 2. 连续随机变量(Con ...

  8. python按概率生成随机数

    Talk is cheap, show me the code. random_demo.py代码如下: # coding: utf-8 import randomdef random_index(r ...

  9. python线程监控配置文件_一日一技:Python多线程的事件监控

    一日一技:Python多线程的事件监控 设想这样一个场景: 你创建了10个子线程,每个子线程分别爬一个网站,一开始所有子线程都是阻塞等待.一旦某个事件发生:例如有人在网页上点了一个按钮,或者某人在命令 ...

最新文章

  1. Xcode7 运行iOS10以上系统(10.1、10.2、10.3)解决Could not find Developer Disk Image
  2. linux(ubuntu版本)安装tengine
  3. mysql relay_技术分享 | MySQL:产生大量小 relay log 的故障一例
  4. fork和vfork,return和exit的理解
  5. python调用chrome插件_Python使用Chrome插件实现爬虫过程图解
  6. html4基础,HTML 基础 4
  7. Python3与OpenCV3.3 图像处理(五)--图像运算
  8. CenterOS防火墙操作
  9. 二叉查找(排序)树/二叉树----建树,遍历
  10. 为什么使用一个变频器控制多个电机?
  11. CuteFtp通用注册码
  12. javaweb项目电子商城购物系统课程设计任务书及成绩评定和毕业设计与实现
  13. oeasy教您玩转python - 002 - # 你好世界 - 各位同学除夕快乐,除旧布新之时预祝能玩
  14. 二维矩阵顺时针旋转90度
  15. 使用Qt实现FTP客户端
  16. 3ds模拟JAVA游戏_3ds模拟器Citra3ds下载
  17. 大白话说期权——除了买涨买跌,我们还能怎么交易?二元期权又是什么鬼?
  18. 投石科技“龙卷风”模拟装置
  19. QNX APS自适应分区调度
  20. 自学python 知乎-为什么自学Python看不进去?

热门文章

  1. 图片pdf合并软件:合并的方法介绍
  2. 前段JavaScript学习---狂神说java笔记
  3. 互联网 IT 精英:龙泉寺静心之旅
  4. 浏览器及Windows常用快捷键汇总
  5. 解决Mysql 主从或主主报1032错误
  6. 【Python】获取数组中非零元素
  7. 共享单车在疯狂造车,ofo为什么要玩连接+共享单车模式?
  8. tkinter点击按钮实现图片的切换
  9. Excel之VLookup函数
  10. js input过滤掉表情输入到方法