一、学习概率分布有什么用?很多现实中的分布都来自几种概率分布。对个人生活和工作选择非常有帮助。

知道某件事发生的概率对我们作出数据分析决策很有帮助。有时候计算概率很简单,有时候计算概率很复杂,概率分布是帮助我们解决特定问题下的万能模版。

在经济学习领域,概率分布对于数据的认识有非常重要的作用,不管是有效数据还是噪音数据,如果知道了数据集分布,在机器学习算法选择和建模过程有很大帮助。

二、概率分布

1.理解概率分布之前需要了解的概念

1)随机事件

在统计概率中我们用事件表示某件事情。

在一定条件下,可能发生可能不发生的事件叫随机事件。如抛硬币。

2)如何量化随机事件——随机变量

随机变量:是一个量化随机事件的函数,它将随机事件每个可能出现的结果赋予一个数字。数字是随机的,可以取任何一个值。如抛硬币:正面朝上用1表示,反面朝上用0表示。通常用X表示。

随机变量有两种类型:离散随机变量和连续随机变量

离散随机变量可能出现的结果都是可以列出来的,如抛硬币,可能出现两种结果,正面朝上1,反面朝上0。

连续随机变量中变量有无限个结果,如明天下雨雨量的毫米数。

将这两种随机变量分隔开,是因为他们有不同的概率分布。

2.概率分布

分布:数据在统计图中的形状叫它的分布。

概率分布:将随机变量、概率、分布组合起来的一种表现手段。就是用统计图来表示随机变量所有可能结果对应发生的概率。横轴是随机事件所有可能的结果(即随机变量的对应的数值),纵轴是对应每个结果发生的概率。

根据随机变量类型的不同,概率分布分为离散概率分布和连续概率分布。

我们可以根据概率计算公式计算这两种随机变量数字的概率。

离散概率分布计算公式用概率质量函数PMF(Probability Mass Function):之所以叫做质量,是因为离散是点,默认体积为1.

连续概率分布计算公式用概率密度函数PDF(Probability Density Function):之所以叫密度,是因为连续随机变量概率计算的是面积。

1)离散概率分布

包括伯努利分布、二项分布、几何分布、泊松分布

伯努利分布:

伯努利实验:同样的条件下进行的相互独立的实验,特点是实验的可能结果只有两种。成功/失败。如果随机变量X是一次伯努利实验,则这个随机变量就符合伯努利分布。

用概率质量函数(PMF)计算伯努利分布的概率,成功概率记作P,失败概率则为1-P。

二项分布:发生次数是固定的,感兴趣的是成功的次数。二项表示随机事件的有两种可能的结果,成功/失败。

特点:

1.做某件事的次数是固定的,次数用n表示,n次某件事是相互独立的。

2.每一次事件都有两种可能的结果,成功/失败

3.每一次成功的概率都相等,成功的概率用p表示

4.想知道成功k次的概率是多少。

二项分布的期望和方差:

期望=np (预期成功多少次)

方差=np(1-p)(数据波动大小)

几何分布:想要知道尝试某件事情多次能取得第一次成功的概率。(二项分布的孪生兄弟)

特点:

1.做某件事的次数是固定的,次数用n表示,n次某件事是相互独立的。

2.每一次事件都有两种可能的结果,成功/失败

3.每一次成功的概率都相等,成功的概率用p表示

4.想知道第k次做某件事,才取得第1次成功的概率是多少。

几何分布的期望和方差:

期望E=1/p (预期多少次后取得第1次成功)

方差=(1-p)/p的平方 (数据波动大小)

泊松分布:某个时间范围内,发生某件事情k次的概率有多大。(如一天内中奖的次数,一个月内机器发生故障的次数,一段道路发生交通事故的次数)

泊松分布的形状会随着平均值的不同而有所变化。

特点:

1.事件是独立事件

2.任意相同的时间范围内,事件发生的概率相同。

3.你想知道某个时间范围内,发生某件事情k次的概率是多大。

要计算泊松分布的概率首先要知道给定时间范围内某件事情发生的平均次数。

泊松分布的期望和方差都等于平均值μ。

2)连续概率分布

包括正态分布和幂律分布

正态分布趋向中间,幂律分布趋向极端。

正态分布:数据集像一只倒扣的钟,两头低中间高,左右对称,大部分数据集中在中间的平均值,小部分在两端,例如上班的薪水。

幂律分布:在有些自然和商业现象中因为网络效应导致强者越强,赢家通吃,这时的结果会呈现出尖刀型的幂律分布。刀尖占据着大部分的财富。

如果想离财务自由更近,需要在给别人打工的同时,建立自己的幂律分布商业模式。

正态分布是商业世界中最常见的一种分布,当影响结果的因素特别多,没有哪个因素可以完全左右这个结果时,结果通常呈现正态分布。

有这两个工具就可以看清很多商业现象。

正态分布的商业现象:1)员工绩效的活力曲线 2)产品质量 3)快速找到停车位 4)智商

幂律分布商业现象:1)家庭收入 2)城市GDP

正态分布特异功能:预测数据的位置

68.2%的数据处于一个标准差内,95.5%的数据处于2个标准差内,99.7%的数据处于3个标准差内。

正态分布概率计算:

正态分布的概率是正态分布图下方一定数值范围内的面积。

1.确定概率范围,明确要求正态分布图中哪一部份的面积。

2.求对应面积的标准分。知道所在数据集的平均值和标准差,就可以算出对应的标准分。标准分就是距离平均值有几个标准差。

3.查找Z表格(标准分与概率值对应关系的表)对应的概率值 。但Z表格给出的是小于标准分的概率值,如果要求大于标准分的面积,用1减去小于标准分的概率值。

三、概率分布的Python实现

套路:

1.伯努利分布

例:抛硬币实验

抛硬币实验1次,正面朝上记作1,翻面朝上记作0。

#导入包

import scipy.stats as stats

import numpy as np

import matplotlib.pyplot as plt

#定义随机变量

X=np.arange(0,2,1)

#求各随机变量的概率

p=0.5

pList=stats.bernoulli.pmf(X,p)

#伯努利分布概率图

plt.plot(X,pList,marker='o',linestyle='None')

plt.vlines(X,0,pList)

plt.xlabel('随机变量:抛硬币1次')

plt.ylabel('概率')

plt.title('伯努利分布:p=%.2f'% p)

plt.show()

2.二项分布

例:5次抛硬币,正面朝上的次数。

#定义随机变量

n=5#抛硬币的次数

p=0.5#正面朝上的概率

X=np.arange(0,6,1)

#求各随机变量的概率

pList=stats.binom.pmf(X,n,p)

#绘图

plt.plot(X,pList,marker='o',linestyle='None')

plt.vlines(X,0,pList)

plt.xlabel('随机变量:抛硬币正面朝上次数')

plt.ylabel('概率')

plt.title('二项分布:n=%i,p=%.2f'% (n,p))

plt.show()

3.几何分布

例:首次表白成功的概率

#定义随机变量

k=5

p=0.6

X=np.arange(1,k+1,1)

#计算各随机变量的概率

pList=stats.geom.pmf(X,p)

#绘图

plt.plot(X,pList,marker='o',linestyle='None')

plt.vlines(X,0,pList)

plt.xlabel('随机变量:表白第k次才首次成功')

plt.ylabel('概率')

plt.title('几何分布:p=%.2f'% p)

plt.show()

4.泊松分布

例:已知一天内某路口平均每天发生2次事故。求该路口一天内发生4次事故的概率。

#定义随机变量

mu=2

k=4#次数,想知道一天内发生4次事故的概率,包含了发生0次,1次,2次,3次,4次

X=np.arange(0,k+1,1)

#计算概率

pList=stats.poisson.pmf(X,mu)

#绘图

plt.plot(X,pList,marker='o',linestyle='None')

plt.vlines(X,0,pList)

plt.xlabel('随机变量:某路口发生k次事故')

plt.ylabel('概率')

plt.title('泊松分布:平均值mu=%.2f'% mu)

plt.show()

python随机数据随概率分布_概率分布及其Python实现相关推荐

  1. python随机生成数字列表_详解Python利用random生成一个列表内的随机数

    首先,需要导入random模块: import random 随机取1-33之间的1个随机数,可能重复: random.choice(range(1,34)) print得到一系列随机数,执行一次得到 ...

  2. python随机生成英文字符串_如何用Python语言生成随机字符串 | 学步园

    这是在Stackoverflow的关于 "用Python语言简洁地生成随机字符串" 的经典问答. 将此文翻译并分享下. 我想生成一个长度为N的字符串. 这个字符串应由数字和大写英文 ...

  3. python随机生成100内的10个整数_用python随机生成数字教程_如何用Python编程随机产生10个随机整数,并输出这10个整数的和�9�3...

    如何用Python编程随机产生10个随机整数,并输出这10个整数的和 用Python编程产生10个随机整数,并整数的和,方法如下 准备材料python.电脑 1.需要加载的模块是:random. 2. ...

  4. python随机生成一个数字_如何实现python随机生成数字?

    今天小编就生成随机数,整理了多个方式,方便大家在项目时,根据自己的需求,直接拿来套用即可,以下内容相当详细,具体来看看吧~ 说明:python中生成随机数主要用到random模块,方法主要包括:ran ...

  5. python分析数据走势图_左大营 | python数据分析篇系列1——探索沪深300指数(附代码)(中)...

    探索沪深300指数(HS300)--基于Python(中) [承接上文] 写在前面:本文只做分析,提供观点,不构成投资建议 如需转载请微信联系:eosO_oke 佛系更新,关注不迷路 沪深300指数是 ...

  6. python数据科学手册_小白入门Python数据科学

    前言 本文讲解了从零开始学习Python数据科学的全过程,涵盖各种工具和方法 你将会学习到如何使用python做基本的数据分析 你还可以了解机器学习算法的原理和使用 说明 先说一段题外话.我是一名数据 ...

  7. python随机森林变量重要性_推荐 :一文读懂随机森林的解释和实现(附python代码)...

    原标题:推荐 :一文读懂随机森林的解释和实现(附python代码) 作者:WilliamKoehrsen:翻译:和中华:校对:李润嘉 本文约6000字,建议阅读15分钟. 本文从单棵决策树讲起,然后逐 ...

  8. 以下哪个不是python财经数据接口工具_这7种Python的全新玩法,大部分人都不知道!...

    Python第三方模块众多,下面我介绍一些比较实用而又有趣的模块,主要分为爬虫.数据处理.可视化.机器学习.神经网络.股票财经.游戏这7个方面,主要内容如下: 创一个小群,供大家学习交流聊天 如果有对 ...

  9. python中奇数怎么表示_如何在python输出数据中的奇数

    如何在python输出数据中的奇数 发布时间:2020-07-10 17:08:48 来源:亿速云 阅读:131 这篇文章将为大家详细讲解有关如何在python输出数据中的奇数,文章内容质量较高,因此 ...

  10. python 数据逐个验证_案例实战 | Python 实现 AB 测试中常见的分层抽样与假设检验 (附代码和数据集)...

    在这里插入图片描述 作者 l 萝卜 本文会将原理知识穿插于代码段中,相关代码和数据集可在公众号 " 数据分析与商业实践 " 后台回复 " AB测试 " 获取. ...

最新文章

  1. python标准异常
  2. WinCE开机默认语言设置 .
  3. 定时器和promise_分析 Promise 内部实现
  4. jquery-ajax请求-1909
  5. 网路游侠:计算机保密检查工具大全 2009版
  6. 各种标点符号的英文翻译
  7. 统计有几个连通分量的另一种方法--hdu 1325
  8. Python电影推荐系统
  9. LABEL MATRIX里用计数器自动生成流水号和自定义条码格式
  10. python输入一个整数_Python中实现输入一个整数的案例
  11. linux下c使用lzma_lzma文件及命令简介
  12. celery 停止_如何解决django-celery启动后迅速关闭
  13. java绘制棋盘_java绘制五子棋棋盘
  14. 大学计算机基础python第二次作业_python第二次作业
  15. 思科路由器开启DNS解析
  16. ncbi blast MATLAB,NCBI-BLAST在线使用教程详细攻略(图解)
  17. 入库订单(组合关系、主从表)模型
  18. 基于ISOMAP算法实现测地线的绘制
  19. 怎么在微软官网找到visual studio历史版本
  20. npm报错`webpack-dev-server --inline --progress --config build/webpack.dev.conf.js`

热门文章

  1. 集成源码深度剖析:Fescar x Spring Cloud
  2. 超干货|使用Keras和CNN构建分类器(内含代码和讲解)
  3. Aruba与中国电信国际有限公司达成战略合作 助力中国企业扬帆出海
  4. 拥抱创新二十载,微软“创新杯”持续孵化中国青年开发者智慧创意
  5. 12 种主流编程语言输出“ Hello World ”,把我给难住了!
  6. 最in的一期,来自大厂的邀请|C课有道
  7. IDEA的基本使用:让你的IDEA有飞一般的感觉 | CSDN 博文精选
  8. 苹果支付60亿美元与高通和解?亚马逊不再运营中国国内市场业务;华为愿同德国签“无间谍软件协议”;Facebook开发语音服务...
  9. python半圆_如何使用Python中的Zelle图形生成一个半圆?
  10. android应用控制百度地图,Android中应用百度地图API开发地图APP实例-显示百度地图...