随机过程基础(1)---一维随机变量标准分布函数、常见性质MATLAB实现
基础概念大部分在高中数学、概率论和离散数学等中已经涉及。
本文根据均匀分布随机数生成正态分布随机变量部分代码摘自《Random Signal Processing》,Shaila Dinkar Apte著,Taylor Francis Group出版。
正态分布
老办法实现:
sigma=1;
mean=0;
x=(-10:0.1:10);
a=(x-mean).*(x-mean);
y=(1/(sigma*sqrt(2*pi)))*exp(-(((x-mean).*(x-mean))/(2*sigma^2)));
plot(x,y,'r-','linewidth',2);xlabel('x');ylabel('pdf');title('Gaussian pdf');
用现成的函数normpdf():
plot(x,normpdf(x,mean,sigma),'r-','linewidth',2);xlabel('x');ylabel('pdf');title('Gaussian pdf');
所得结果与上相同。
使用normcdf查看标准正态概率分布:
函数norminv(P,MU,SIGMA),计算参数为MU SIGMA的正态概率分布函数对应概率为P处的反函数值。
误差函数erf(x)erf(x)=2π∫0xe−u2duerf(x)=\frac{2}{\sqrt{\pi}}\int_{0}^{x}e^{-u^{2}}duerf(x)=π2∫0xe−u2du反函数为erfinv(x);
此外还有补余误差函数Y=erfc(X) =1-erf(x)。与标准正态分布的关系是ϕ(x)=12erfc(−x2)\phi(x)=\frac{1}{2}erfc(-\frac{x}{\sqrt{2}})ϕ(x)=21erfc(−2x)其反函数为erfcinv(x)。
瑞利分布
来源:两个独立且方差相等的正态分布随机变量的平方和的开方
概率密度fX(x)={2b2(x−α)e−(x−α)2/2b2,x>α0,x<αf_X(x)=\{\begin{array}{lr} {\frac{2}{b^2}(x-\alpha)e^{-(x-\alpha)^2/2b^2} ,x > \alpha}\\ 0,~~~x<\alpha \end{array}fX(x)={b22(x−α)e−(x−α)2/2b2,x>α0, x<α概率分布FX(x)=P(X≤x)=1−e−(x−α)22b2x≥αF_X(x) = P(X \le x) = 1 - e^\frac{-(x-\alpha)^2 }{2b^2} \qquad \qquad x \ge \alpha FX(x)=P(X≤x)=1−e2b2−(x−α)2x≥αFX(x)=0x<αF_X(x)=0\qquad\qquad\qquad\qquad \qquad \qquad \qquad x<\alphaFX(x)=0x<αmatlab有现成函数raylpdf(X,B)求瑞利分布概率密度。
x=[0:0.01:5];
b=0.5;
p=raylpdf(x,b);
plot(x,p,'g','linewidth',2); title('Rayleigh density function pdf'); xlabel('value of x');ylabel('pdf');
概率分布函数:raylcdf(X,B)
p=raylcdf(x,b);
plot(x,p,'linewidth',2); title('Rayleigh CDF'); xlabel('value of x');
ylabel('CDF');
同理,指数分布通过老办法或现成的函数exppdf(X,MU)和expcdf(X,MU)FX(x)={1−e−(x−a)/bx≥a0x<aF_X(x) = \{\begin{array}{lr}1-e^{-(x-a)/b}~~~x \ge a\\0~~~~~~~~x < a\end{array}FX(x)={1−e−(x−a)/b x≥a0 x<afX(x)={1be−(x−a)/bx≥a0x<af_X(x) = \{\begin{array}{lr}\frac{1}{b}e^{-(x-a)/b}~~~x \ge a\\0~~~~~~~~x < a\end{array}fX(x)={b1e−(x−a)/b x≥a0 x<a
plot(x,exppdf(x,0.25),'linewidth',2);xlabel('x');ylabel('pdf');title('exponential pdf');
plot(x,expcdf(x,0.25),'linewidth',2);xlabel('x');
ylabel('cdf');title('exponential cdf');
此外,matlab还有均匀分布概率密度unifpdf(X,A,B),均匀分布概率分布unifcdf(X,A,B)等。
以上都有现成的函数,实现简单。接下来讨论离散随机变量。
二项分布
概率密度:fX(x)=∑k=0NN!(N−k)!k!Pk(1−P)N−kδ(x−k)f_X(x)=\sum_{k=0}^N\frac{N!}{(N-k)!k!}P^k(1-P)^{N-k}\delta(x-k)fX(x)=k=0∑N(N−k)!k!N!Pk(1−P)N−kδ(x−k)以下用P=0.2,N=6绘制二项分布相关函数。matlab函数用法参见:
matlab官方文档_binopdf
matlab官方文档_stem
x=0:20;
y=binopdf(x,20,0.25);
stem(x,y);title('Binomial pdf function for N=20 and P=0.25');xlabel('x');
ylabel('pdf value');
figure;
clear all;
x=0:20;
y=binocdf(x,20,0.25);
stem(x,y,':diamondr');title('Binomial CDF function for N=20 and P=0.25');xlabel('x');
ylabel('CDF value');
泊松分布
是二项分布实验次数趋近无穷时,P趋向于0,从而NP乘积等于常量b的情况。pdf和cdf写作fX(x)=e−b∑k=0∞bkk!δ(x−k)f_X(x)=e^{-b}\sum_{k=0}^{\infty}\frac{b^k}{k!}\delta(x-k)fX(x)=e−bk=0∑∞k!bkδ(x−k)FX(x)=e−b∑k=0∞bkk!u(x−k)F_X(x)=e^{-b}\sum_{k=0}^{\infty}\frac{b^k}{k!}u(x-k)FX(x)=e−bk=0∑∞k!bku(x−k)matlab函数为poisspdf(x,lambda):
clear all;
x=0:20;
y=poisspdf(x,0.7);
stem(x,y);title('Poisson pdf function for N=20 and lamda=0.7');xlabel('x');ylabel('pdf value');
figure;clear all;
x=0:20;
y=poisscdf(x,0.7);
stem(x,y,':diamondr');title('Poisson CDF function for N=20 and lamda=0.7');xlabel('x');ylabel('CDF value');
使用中心极限定理生成服从高斯分布的随机变量
随机生成10组元素服从均匀分布、居于01之间的100×100矩阵。将这10个随机矩阵相加,通过hist命令按照最大最小间隔分成10份统计落在每一份中的数目。可以看出得出的结果和高斯分布十分相似。如果将矩阵改为1000*1000,会更加近似为正态分布。
clear all;
x1=rand(100);
x2=rand(100);
x3=rand(100);
x4=rand(100);
x5=rand(100);
x6=rand(100);
x7=rand(100);
x8=rand(100);
x9=rand(100);
x10=rand(100);
y=(1/sqrt(10))*(x1+x2+x3+x4+x5+x6+x7+x8+x9+x10);
z=hist(y,10);
bar(z);title('plot of a sum variable');
xlabel("bin value");
ylabel("amplitude");
利用以上方法,可以简单地统计音乐信号中样本点的分布:
相关函数:matlab_fseek ;matlab_fread
fp=fopen('example.wav');
fseek(fp,1500000,-1);
a=fread(fp,2048);
subplot(2,1,1);plot(a);title('plot of voiced part of a signal');
xlabel('sample no.');ylabel('amplitude');
b=hist(a,100);
figure;
bar(b);
title('plot of a histogram for a piece of music');xlabel('bin value');ylabel('amplitude');
样本点分布的两个统计峰值说明样本点在这两个区间出现频次异常高,取何种区间都有两个峰,但是峰的位置差别很大。这是需要探讨的问题。
卡方检验
基础概念高中已涉及。高中时用于判断两随机变量是否相关。卡方检验的本意不是判断独立性,而是判断预测模型是否准确。用在判断独立性上,如果两者相关,就说明用两者独立的结论来模拟的结果与实际结果不符。
卡方检验的式子是:χ2=∑i=1N(gi−fi)2fi\chi^2=\sum_{i=1}^{N}\frac{(g_i-f_i)^2}{f_i}χ2=i=1∑Nfi(gi−fi)2其中fi是预测模型得出值,gi是实际值。容易由这个式子和独立假设推出高中常用的独立样本四格表,及常用公式n(ad−bc)2(a+b)(c+d)(a+c)(b+d)\frac{n(ad-bc)^2}{(a+b)(c+d)(a+c)(b+d)}(a+b)(c+d)(a+c)(b+d)n(ad−bc)2
K-S检验
给一组未知分布的观测值,F(x)是对应某标准分布的对应值(在例子中是落在某个窄带区间的频数,如果D=max∣F(x)−G(x)∣D=max|F(x)-G(x)|D=max∣F(x)−G(x)∣得到的结果如果比K-S表中对应的小,那么可以用已知标准分布拟合未知分布。
这里使用K-S检验法检验从上述信号得到分布如果用随机数生成的正态分布拟合的优劣。
fp=fopen('example.wav');
fseek(fp,1500000,-1);
a=fread(fp,2048);
subplot(2,1,1);plot(a);title('plot of voiced part of a signal');
xlabel('sample no.');ylabel('amplitude');
b=hist(a,100);
subplot(2,1,2);
bar(b);
title('plot of a histogram for a speech segment');xlabel('bin value');ylabel('amplitude');
x1=rand(100);
x2=rand(100);
x3=rand(100);
x4=rand(100);
x5=rand(100);
x6=rand(100);
x7=rand(100);
x8=rand(100);
x9=rand(100);
x10=rand(100);
x11=rand(100);
x12=rand(100);
y=(1/sqrt(12))*(x1+x2+x3+x4+x5+x6+x7+x8+x9+x10+x11+x12);
z=hist(y,100);
figure;
bar(z);title('plot of a sum variable generated using Central limit theorem');xlabel('bin value');ylabel('amplitude');
sum=0.0;
for i=1:100,
d(i)=abs(b(i)-z(i));
sum=sum+d(i);
end
disp(sum);
得到的距离远大于K-S表中的对应值,说明用这种正态分布拟合该段信号的分布特别不可信。所以不能用正态分布拟合这段信号。
随机过程基础(1)---一维随机变量标准分布函数、常见性质MATLAB实现相关推荐
- 外部函数获取内部函数变量_一维随机变量的分布函数
一.分布函数.概率密度 (一)一维随机变量的分布函数 (二)一维离散型随机变量的概率分布 (三)一维连续型随机变量的概率密度 (四)一维连续型随机变量的函数的概率密度 如:设X的概率密度为f(x), ...
- 如何把密度函数化为标准正态二维分布_概率微课:第三章(22) 二维随机变量及分布函数定义...
主要内容 二维随机变量及分布函数定义 更多系列视频 概率微课:第二章(1) 随机变量的定义 概率微课:第二章(2) 离散型随机变量 概率微课:第二章(3) 两点分布及伯努利试验 概率微课:第二章( ...
- 【概率论基础进阶】随机变量及其分布-随机变量及其分布函数
文章目录 一.分布律 分布律性质 二.分布函数 分布函数的性质 三.概率密度 概率密度的性质 一.分布律 定义:在样本空间 Ω \Omega Ω上的实值函数 X = X ( ω ) X=X(\omeg ...
- 概率论考点之指数分布,泊松分布及积分(一维随机变量内容)
因为做项目的原因,不能集中精力去复习,还是发现概率论有难度,可能是高数学的太差了吧!到10月17日考试,剩58天,估计是有些困难的,先不备考概率论了,临时转向备考数据库.留出空余的时间来复习高数.和软 ...
- 概率论笔记—一维随机变量及其分布
目录 一.随机变量 二.分布函数 三.离散型随机变量 四.连续型随机变量 五.常见的离散型随机变量分布类型 六.常见的连续型随机变量分布类型 一.随机变量 随机变量就是"其值会随机而定&qu ...
- 随机过程基础(4)---各态历经性、典型随机过程matlab仿真
各态历经性部分基础公式源自<随机信号分析与处理>,罗鹏飞等著,清华大学出版社,公式旁有标注*:部分参考资料源自 https://en.wikipedia.org. http://www.m ...
- 概率论(二)随机变量及其概率分布——离散和连续型随机变量及其分布函数
本节知识点 1.随机变量及其分布函数的定义 2.离散型随机变量 定义:随机变量可能取得的值是有限个或者可列无限个 概率分布列 分布函数 常见的离散性随机变量:0-1分布.二项分布和泊松分布 3.连续型 ...
- UA MATH563 概率论的数学基础2 随机变量1 随机变量与分布函数
UA MATH563 概率论的数学基础2 随机变量1 随机变量与分布函数 判断一个实变函数是随机变量 分布函数的性质 Lebesgue-Stieltjes测度下的分布函数 现在我们考虑状态空间(Ω,F ...
- 统计学基础5-多维随机变量及其分布
文章目录 一. 简单的导数的知识 二. 二维随机变量 2.1 案例回顾 2.2 二维随机变量概述 2.3 离散与连续 2.4 联合分布律 2.5 联合概率密度 三. 多维随机变量 3.1 边缘分布 3 ...
- 【概率论与数理统计 Probability and Statistics 8】—— 深入地理解二维随机变量及其分布函数、分布密度函数的意义
文章目录 一.为什么是二维随机变量 二.二维随机变量的分布函数 2.1 二维随机变量分布函数的性质 2.2 二维随机变量的边缘分布函数 三.二维离散型随机变量的联合分布和边缘分布求法 四.二维连续型随 ...
最新文章
- 【学习笔记】矩阵树定理(Matrix-Tree)
- 2021-03-28为什么用SCALA语言优势在哪里 Scala适合服务端、大数据、数据挖掘、NLP、图像识别、机器学习、深度学习…等等开发。
- substring java_Java String.substring()用法
- ***S 2012 交互式报表 -- 钻取式报表
- 旧金山GDC2008见闻一
- java treemap 内存_Java中Map、HashMap、LinkedHashMap、TreeMap的区别
- micropython和python区别-MicroPython入坑记(三)板子上的Python到底有多快?
- tensorflow搭建神经网络
- python图书馆管理系统 面向对象_python---面向对象程序设计之图书管理系统
- 国内博客(blog)搬家工具(服务)大全
- vdbench数据校验翻译
- WordPress站点上传文件插件WordPress File Upload
- 【寒江雪】Go实现单例模式
- MySQL 存储过程的写法
- redis优化,bigkey,hotkey,配置优化,缓存雪崩、缓存穿透、缓存击穿
- vue3 全局注册app.config.globalProperties, 如何处理getCurrentInstance 上下文线上环境报错
- Keras框架下的loss损失函数
- matlab局部放大曲线功能
- AWS亚马逊云EC2搭建ginblog系统
- 在计算机内部 g的asc,在计算机内部,大写字母“G”的ASCⅡ码为“1000111”,大写字母“K”的ASCⅡ码为()。...