stats | 概率分布与随机数生成(二)——均匀分布、指数分布、正态分布、对数正态分布、卡方分布、t分布、F分布和增长分布
这是数学模型板块的第二篇推文,上篇介绍了几种离散型分布,从本篇开始介绍连续型概率分布。假定某个连续型分布的取值范围为[a, b](a、b可以取无穷),则其概率密度函数与概率分布函数的关系:
1 均匀分布
如果在[a, b]范围内任意相同间隔长度内的概率是等同的,那么X就服从均匀分布(Uniform Distribution),记为。
均匀分布在取[a, b]间的任意值的概率密度函数都是。
stats
中的相关函数有:
dunif(x, min = 0, max = 1, log = FALSE)
punif(q, min = 0, max = 1, lower.tail = TRUE, log.p = FALSE)
qunif(p, min = 0, max = 1, lower.tail = TRUE, log.p = FALSE)
runif(n, min = 0, max = 1)
min
和max
分别相当于a
和b
;其他参数含义同stats | 概率分布与随机数生成(一)——离散型分布。
# 概率密度
dunif(seq(1,11,0.5), 1, 11)## [1] 0.1 0.1 0.1 0.1 0.1 0.1 0.1 0.1 0.1 0.1 0.1 0.1 0.1 0.1 0.1 0.1 0.1 0.1 0.1
## [20] 0.1 0.1# 已知X求累积概率
punif(seq(1,11,0.5), 1, 11)## [1] 0.00 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50 0.55 0.60 0.65 0.70
## [16] 0.75 0.80 0.85 0.90 0.95 1.00# 已知累积概率求X
qunif(seq(0,1,0.05), 1, 11)## [1] 1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 5.5 6.0 6.5 7.0 7.5 8.0
## [16] 8.5 9.0 9.5 10.0 10.5 11.0# 生成符合均与分布的随机数
runif(10, 1, 11)## [1] 6.302010 5.699884 9.597925 9.065036 1.272223 7.165098 6.938233 3.395326
## [9] 7.864294 5.044557
2 指数分布
在泊松过程中(事件在单位时间内发生次数的数学期望恒定,即),则事件第一次发生所需要的时间长度符合指数分布(Exponential Distribution),记为。
指数分布的概率密度函数:
指数分布具有“无记忆性”,即
stats
中的相关函数有:
dexp(x, rate = 1, log = FALSE)
pexp(q, rate = 1, lower.tail = TRUE, log.p = FALSE)
qexp(p, rate = 1, lower.tail = TRUE, log.p = FALSE)
rexp(n, rate = 1)
参数
rate
相当于。
概率密度函数关于的变化图象:
curve(dexp(x, 0.1), 0, 50, col = rgb(0.1, 0, 0.9), lwd = 2)
for(i in seq(0.2, 0.9, 0.1)) {curve(dexp(x, i), 0, 50, col = rgb(i, 0, 1-i), lwd = 2, add = T)
}
legend("topright", legend = seq(0.1, 0.9, 0.1), lty = 1, xpd = T,col = c(rgb(seq(0.1, 0.9, 0.1), 0, 1-seq(0.1, 0.9, 0.1))),title = expression(lambda), lwd = 2)
3 正态分布
正态分布(Normal Distribution),又称高斯分布(Gaussian Distribution),记为。
正态分布的概率密度函数:
正态分布的性质:
stats
中的相关函数有:
dnorm(x, mean = 0, sd = 1, log = FALSE)
pnorm(q, mean = 0, sd = 1, lower.tail = TRUE, log.p = FALSE)
qnorm(p, mean = 0, sd = 1, lower.tail = TRUE, log.p = FALSE)
rnorm(n, mean = 0, sd = 1)
mean
和sd
分别相当于和。
概率密度函数关于的变化图象:
curve(dnorm(x, 0, 0.1), -1, 1, col = rgb(0.1, 0, 0.9), lwd = 2, n = 400)
for(i in seq(0.2, 0.9, 0.1)) {curve(dnorm(x, 0, i), -1, 1, col = rgb(i, 0, 1-i), lwd = 2, add = T, n = 400)
}
legend("topright", legend = seq(0.1, 0.9, 0.1), lty = 1, xpd = T,col = c(rgb(seq(0.1, 0.9, 0.1), 0, 1-seq(0.1, 0.9, 0.1))),title = expression(sigma), lwd = 2)
4 对数正态分布
如果服从正态分布,则服从对数正态分布(Log Normal Distribution)。
对数正态分布的概率密度函数:
数学期望和方差:
stats
中的相关函数有:
dlnorm(x, meanlog = 0, sdlog = 1, log = FALSE)
plnorm(q, meanlog = 0, sdlog = 1, lower.tail = TRUE, log.p = FALSE)
qlnorm(p, meanlog = 0, sdlog = 1, lower.tail = TRUE, log.p = FALSE)
rlnorm(n, meanlog = 0, sdlog = 1)
meanlog
和sdlog
分别相当于和。
概率密度函数关于的变化图象:
curve(dlnorm(x, 0, 0.1), 0, 2, col = rgb(0.1, 0, 0.9), lwd = 2, n = 400)
for(i in seq(0.2, 0.9, 0.1)) {curve(dlnorm(x, 0, i), 0, 2, col = rgb(i, 0, 1-i), lwd = 2, add = T, n = 400)
}
legend("topright", legend = seq(0.1, 0.9, 0.1), lty = 1, xpd = T,col = c(rgb(seq(0.1, 0.9, 0.1), 0, 1-seq(0.1, 0.9, 0.1))),title = expression(sigma), lwd = 2)
可以看出,在较小时,对数正态分布很接近正态分布。
5 卡方分布
n个互相独立且都服从标准正态分布的随机变量平方和服从卡方分布(Chi-Squared Distribution),即
记为。称为卡方分布的自由度。
stats
中的相关函数有:
dchisq(x, df, ncp = 0, log = FALSE)
pchisq(q, df, ncp = 0, lower.tail = TRUE, log.p = FALSE)
qchisq(p, df, ncp = 0, lower.tail = TRUE, log.p = FALSE)
rchisq(n, df, ncp = 0)
df
为卡方分布的自由度。
概率密度函数关于的变化图象:
curve(dchisq(x, 1), 0.5, 20, col = rgb(0.1, 0, 0.9), lwd = 2, n = 400)
for(i in seq(0.2, 0.9, 0.1)) {j = 10*icurve(dchisq(x, j), 0.5, 20, col = rgb(i, 0, 1-i), lwd = 2, add = T, n = 400)
}
legend("topright", legend = seq(1, 9, 1), lty = 1, xpd = T,col = c(rgb(seq(0.1, 0.9, 0.1), 0, 1-seq(0.1, 0.9, 0.1))),title = expression(n), lwd = 2)
6 t分布
若服从标准正态分布,服从自由度为的卡方分布,
则服从t分布(Student t Distribution),记为。称为t分布的自由度。
t分布的自由度越大,越接近正态分布。
stats
中的相关函数有:
dt(x, df, ncp, log = FALSE)
pt(q, df, ncp, lower.tail = TRUE, log.p = FALSE)
qt(p, df, ncp, lower.tail = TRUE, log.p = FALSE)
rt(n, df, ncp)
df
为t分布的自由度。
概率密度函数关于的变化图象:
curve(dt(x, 1), -5, 5, col = rgb(0.1, 0, 0.9), lwd = 2, n = 400, ylim = c(0, 0.4))
for(i in seq(0.2, 0.9, 0.1)) {j = 10*icurve(dt(x, j), -5, 5, col = rgb(i, 0, 1-i), lwd = 2, add = T, n = 400)
}
legend("topright", legend = seq(1, 9, 1), lty = 1, xpd = T,col = c(rgb(seq(0.1, 0.9, 0.1), 0, 1-seq(0.1, 0.9, 0.1))),title = expression(n), lwd = 2)
7 F分布
若和分别服从自由度为和的卡方分布,
则服从F分布(F Distribution),记为。和称为F分布的自由度。
stats
中的相关函数有:
df(x, df1, df2, ncp, log = FALSE)
pf(q, df1, df2, ncp, lower.tail = TRUE, log.p = FALSE)
qf(p, df1, df2, ncp, lower.tail = TRUE, log.p = FALSE)
rf(n, df1, df2, ncp)
df1
和df2
分别相当于和。
概率密度函数关于的变化图象:
curve(df(x, 2, 5), 0, 3, col = rgb(0.1, 0, 0.9), lwd = 2, n = 400)
for(i in seq(0.3, 0.9, 0.1)) {j = 10*icurve(df(x, j, 5), 0, 20, col = rgb(i, 0, 1-i), lwd = 2, add = T, n = 400)
}
legend("topright", legend = seq(2, 9, 1), lty = 1, xpd = T,col = c(rgb(seq(0.2, 0.9, 0.1), 0, 1-seq(0.2, 0.9, 0.1))),title = expression(n[1]), lwd = 2)
概率密度函数关于的变化图象:
curve(df(x, 5, 2), 0, 3, col = rgb(0.1, 0, 0.9), lwd = 2, n = 400, ylim = c(0, 0.7))
for(i in seq(0.2, 0.9, 0.1)) {j = 10*icurve(df(x, 5, j), 0, 3, col = rgb(i, 0, 1-i), lwd = 2, add = T, n = 400)
}
legend("topright", legend = seq(2, 9, 1), lty = 1, xpd = T,col = c(rgb(seq(0.2, 0.9, 0.1), 0, 1-seq(0.2, 0.9, 0.1))),title = expression(n[2]), lwd = 2)
8 Logistic分布
逻辑斯蒂分布(Logistic Distribution),又称增长分布。其
概率分布函数:
概率密度函数:
是中心参数,也是Logistic分布的数学期望;
是分散参数;
,时称为标准Logistic分布。
stats
中的相关函数有:
dlogis(x, location = 0, scale = 1, log = FALSE)
plogis(q, location = 0, scale = 1, lower.tail = TRUE, log.p = FALSE)
qlogis(p, location = 0, scale = 1, lower.tail = TRUE, log.p = FALSE)
rlogis(n, location = 0, scale = 1)
location
和scale
分别相当于和。
标准Logistic分布的累积概率函数和概率密度函数:
curve(plogis, -10, 10, col = "blue", lwd = 2)
curve(dlogis, -10, 10, col = "red", lwd = 2, add = T)
stats | 概率分布与随机数生成(二)——均匀分布、指数分布、正态分布、对数正态分布、卡方分布、t分布、F分布和增长分布相关推荐
- python stats画正态分布、指数分布、对数正态分布的QQ图
stats.probplot(grade, dist=stats.norm, plot=plt) #正态分布# stats.probplot(grade, dist=stats.expon, plot ...
- stats | 概率分布与随机数生成(一)——离散型分布
随机变量的分布模式是统计模型的基础,R的基础包stats提供了许多关于概率分布的函数.本篇主要介绍离散型分布,包括两点分布.二项分布.帕斯卡分布.负二项分布.几何分布.超几何分布和泊松分布. 1 st ...
- stats | 广义线性模型(二)——泊松回归
本篇介绍一种常见的广义线性模型:泊松回归.泊松分布是离散型分布,它的概率分布函数如下: 写成指数族分布的形式如下: 对照指数族分布的通式: 可得, 广义线性模型假设与解释变量存在线性关系,即 又因为泊 ...
- PT_常见的连续型分布/均匀分布/指数分布/柯西分布/正态分布
文章目录 常见的连续型分布/均匀分布/指数分布/柯西分布/正态分布 均匀分布 性质 例 指数分布 无记忆性 ref 例 柯西分布 正态分布
- [数学]二维对数正态分布的概率分布,期望,方差和相关系数
最近遇到了一个联合对数正态分布的相关系数的问题,搜遍全网无果,索性自己动手.本文借鉴了这个知乎回答 首先我们有二维正态分布: X , Y ∼ B V N ( μ x , μ y , σ x 2 , σ ...
- 机器学习中的数学——常用概率分布(六):指数分布(Exponential分布)
分类目录:<机器学习中的数学>总目录 相关文章: · 常用概率分布(一):伯努利分布(Bernoulli分布) · 常用概率分布(二):范畴分布(Multinoulli分布) · 常用概率 ...
- 机器学习中的数学——常用概率分布(十二):逻辑斯谛分布(Logistic 分布)
分类目录:<机器学习中的数学>总目录 相关文章: · 常用概率分布(一):伯努利分布(Bernoulli分布) · 常用概率分布(二):范畴分布(Multinoulli分布) · 常用概率 ...
- Javascript 产生随机数——服从均匀分布随机数、服从正态分布(高斯分布)随机数、服从柯西分布随机数
文章目录 1 产生服从均匀分布随机数 2 产生服从正态分布随机数 3 产生服从柯西分布随机数 1 产生服从均匀分布随机数 大家都知道Math.random是 javascript 中返回伪随机数的方法 ...
- 均匀分布 卡方分布_【Math】概率论常用分布大全
目录 离散分布 连续分布 三大常见抽样分布 1.离散分布 Bernoulli分布(0-1分布.两点分布) X~B(1,p) EX=p,DX=p(1-p) 二项分布 X~B(n,p) n很大,p很小可看 ...
- MATLAB中曲线拟合方法总结(包括对数正态分布函数)
鉴于最近遇到非线性函数拟合问题,本人对网上有关matlab多种类型的线性.非线性曲线拟合的方法进行了总结,希望对各位朋友有所帮助. 1. Matlab有一个功能强大的曲线拟合工具箱 cftool ,使 ...
最新文章
- 设计模式之观察者模式(Observer)摘录
- Spring 系列,第 3 部分: 进入 Spring MVC
- python 录制网易云登陆_图说Python菜鸟版:第3章 基本语法
- 3.1.4 操作系统之内存的分配与回收
- 多维列表索引_10分钟带你学会Pandas多层级索引
- 推荐算法--利用用户标签数据(04)
- python粒子风暴代码_turtle爆炸粒子效果源码
- Linux的文件压缩与解压缩
- linux 实用命令 —— cut、tr、sort、touch
- 众说纷“云”之云安全企业用户追踪寻访
- double d C语言,1,若有以下定义,char a;int b;float c;double d;... 若有以下语句,则正确的描述是,C语言...
- Web编程入门暨个人网站计划:Web前端开发入门
- Netty内置处理器整理
- 角摩电子书制作工具(JoymoEBook)v1.0绿色版
- 学生签到系统c代码_C语言学生管理系统源码分享
- 【CANN训练营第三季】【进阶班笔记3】PyTorch安装与环境配置
- Java 并发编程解析 | 如何正确理解Java领域中的多线程模型,主要用来解决什么问题?
- 看美女怎样将正装穿出性感范儿(多图)
- 基于混沌映射的自适应樽海鞘群算法
- 【观察】当 SmartX 遇见英特尔傲腾,超融合系统性能突破新极限