https://www.toutiao.com/a6681959320441061900/

通信-随机过程系列第2篇

尽管随机实验结果的意义是明确的，但这种结果往往是不利于进行数学分析的。例如，随机实验结果是硬币的正面或反面，这并不是一个方便的数学表示。

开篇问题：如果一个喷泉每91分钟喷发一次。你随机来到哪里，逗留了20分钟。你看到它喷发的概率是多少？

为何要引入随机变量

在这些情况下，如果我们为随机实验的结果分配一个数字或一系列值，通常会更方便。例如，硬币的正面可以对应1，反面可以对应于0。为随机实验的结果分配一个数字的过程，我们叫做用随机变量表达。

图1 抛掷硬币的结果与随机变量

一个随机试验的样本空间为S，随机实验的结果是s，s是S中的元素，s∈S，定义一个函数X(s)，其中定义域为S，值域为实数的子集，这个函数叫叫作随机变量。

图2表述了随机变量的概念。在概率与样本空间之间，添加一个随机变量，这样更有利于数学计算。

图2 随机变量的概念

使用随机变量的好处是，无论随机实验潜在事件的形式如何，现在都可以根据实际值的数量来进行概率分析。随机变量可能是离散的，并且只接受有限的数值，例如在抛硬币实验中。或者，随机变量可以是连续的，并接受一系列的实数。

举例1：抛3个硬币会得到几个正面？

X="正面的个数" 是随机变量。可以有0个正面(如果所有硬币都是反面向上)、1个正面、2个正面或3个正面。所以样本空间={0, 1, 2, 3}。

但现在结果的概率不再完全是相等的了。

三个硬币可以抛出八个结果：

图3 抛3次硬币，H代表正面头像，T代表反面

在图3里我们可以看到只有1个结果有三个正面，但有 3个结果有两个正面，3个结果有一个正面，和 1个结果没有正面。所以:

P(X=3)=1/8
P(X=2)=3/8
P(X=1)=3/8
P(X=0)=1/8

举例2：2个骰子Dice的点数之和

现在我们同时抛掷2个骰子Dice，并定义随机变量X="两个骰子点数之和".

图4 抛掷2个骰子的试验

那么一共会有6×6 =36个可能的结果，见图4所示，样本空间S是{2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12}；

我们可以数一数样本空间中每个值发生的频率，并计算它们的概率：

2仅出现1次, 所以P(X=2)=1/36；
3出现2次所以P(X=3)=2/36=1/18；
4出现3次, 所以P(X=4)=3/36=1/12；
5出现4次, 所以P(X=5)=4/36=1/9；
6出现5次, 所以P(X=6)=5/36；
7出现6次, 所以P(X=7)=6/36=1/6；
8出现5次, 所以P(X=8)=5/36；
9出现4次, 所以P(X=9)=4/36=1/9；
10出现3次, 所以P(X=10)=3/36=1/12；
11出现2次,所以P(X=11)=2/36=1/18；
12出现1次, 所以P(X=12)=1/36；

两个骰子的点数的和是5、6、7或8的概率是多少？

就是：P(5≤X≤8) 是多少？

由于随机变量取值是离散的，P(5≤X≤8)=P( X=5)+P(X=6)+P(X=7)+P(X=8)=(4+5+6+5)/36=20/36=5/9

同样的，在表示特定时刻噪声电压幅值的随机变量是一个连续的随机变量，因为理论上，它可能具有正负无穷大之间的任意值。随机变量也可能是复值的，但复值随机变量总是被视为两个实值随机变量的向量。

对于硬币抛掷试验，我们可以这样描述：

图5 硬币抛掷试验

x=0对应结果为硬币的反面，x=1对应结果为硬币的正面，P[X=x]表示出现事件x的概率。图5中有2个delta函数，权重为1/2，表示了抛掷硬币的2种结果。

连续随机变量

随机变量可以是离散或连续的：

离散数据只能取某些数值(例如 1、2、3、4、5)
连续数据可以取一个范围(值域)里的任何数值(例如人的身高)

离散的随机变量如举例1和2所示，在这里，我们重点说一下连续随机变量。

均匀分布(也称为矩形分布)

在均匀分布中，a和b之间所有的随机变量的概率是相等的。不像取值是离散的随机变量，这里a和b之间有无数个取值，是连续的。但不管怎样，所有概率之和一定为1。

图6 均与分布

因为所有概率的和一定是1，所以矩形的面积=1，p×(b−a)=1，所以p=1/(b−a)；

还可以写成：若a≤x≤b，P(X=x)=1/(b−a) ，否则P(X=x)=0

再看开篇喷泉的问题。

答案很容易，91分之20是：p=20/91=0.22；

你是随机到达喷泉，如果你等91分钟，那么你便一定会(p=1)看到它喷发。

所以你到达喷泉处，要么能立马看到喷发，或者在91分钟里的任何时间看到。

图7 91分钟内的均匀

累积均匀分布

我们也可以有累积均匀分布，如图8所示。

图8 累积均匀分布

这种分布叫 "累积分布函数"，英语是 "cumulative distribution function"，简称 "CDF"

现在用以上均匀分布的 "CDF" 来计算概率：

图9 CDF计算概率

在a+20，概率累积到大约0.22。

概率密度函数

如图9所示，分布函数可以表示为Fx(x)，随机变量X取小于或等于x的任何值的概率。公式见图10-1。

图10 概率分布函数

概率分布函数Fx(x)有3个基本的属性：

概率分布函数Fx(x)取值在0和1之间；
概率分布函数Fx(x)是一个单调不减函数，如图10公式2；
如果X是连续随机变量，且Fx(X)是可微的，那么可以定义概率密度函数fx(x)，图10公式3

除了CDF，还有一个英语叫作 "probability density function"的函数，简称 "pdf"

图11 PDF

概率密度函数PDF具有如下4个基本属性：

图12 PDF的4个基本属性

我们考察一个随机变量X位于x1和x2之间的概率，由定义可以得到

正态分布

最重要的连续分布是标准正态分布。它非常重要，连它的随机变量也有独特的名字： Z.

Z的图形是个对称的钟形曲线，图13：

图13 正态分布曲线

通常我们需要求Z在两个数值之间的概率。如 P(0<Z<0.45)(Z在0与0.45 之间的概率是多少)

用标准正态分布表来求答案。从0开始，向右去到0.45，答案是 0.1736。

P(0<Z<0.45)=0.1736。

图14 计算概率

随机变量的统计量

随机变量的取值是随机的，让人琢磨不定。但是我们总是要抽取一些确定的数值，才能掌握随机变量的特征。这些确定的数值，就是随机变量的统计量。

一般地，随机变量的N阶矩定义为

一阶矩是随机变量的均值MEAN，二阶矩是功率。

如果把随机变量的均值减掉，再求N阶矩，得到的是N阶中心矩。

一阶中心矩一定是零，二阶中心矩叫作方差。

方差是非常重要的统计量，它反映的是随机变量偏离均值的程度。

对于零均值信号，方差也等于信号的功率。对于非零均值信号，方差=功率-均值的平方。

随机变量，概率密度及其统计量相关推荐

统计学基础之常用统计量和抽样分布
目录: 一.统计量 1.概念 2.常用统计量二.抽样分布 1.常见三大抽样分布一.统计量: 1.概念: 统计量是统计理论中用来对数据进行分析.检验的变量.在实际应用中,当我们从某个总体中抽取一个样 ...
【人工智能】— 不确定性、先验概率/后验概率、概率密度、贝叶斯法则、朴素贝叶斯、最大似然估计
[人工智能]- 不确定性不确定性不确定性与理性决策基本概率符号先验概率(无条件概率)/后验概率(条件概率) 随机变量概率密度联合概率分布公理完全联合分布概率演算独立性贝叶斯法则 ...
【概率论基础进阶】多维随机变量及其分布-二维随机变量及其分布
文章目录一.二维随机变量分布函数F(x,y)F(x,y)F(x,y)的性质二.二维离散型随机变量分布律pijp_{ij}pij的性质三.二维连续型随机变量概率密度f(x,y)f(x,y) ...
大数据之统计学基础(二)：随机变量及其概率分布
随机变量及其概率分布随机变量(r.v)是研究随机试验中的一串事件:比如掷一颗骰子,用X表示骰子的点数,由于X的取值我们无法确定,所以称X是一个随机变量,随机变量的取值随机会而定. 1.随机变量的类型 ...
统计3：样本和统计量
统计推断是指,在数理统计中,我们研究的随机变量,其分布是未知的,或者是不完全知道的,人们是通过对所研究的随机变量进行重复独立的观察,得到许多观察值,对这些数据进行分析,从而对所研究的随机变量的分布做出 ...
随机变量及其分布和几种常见分布
符号 (I)(I)(I)(0-1)分布(离散型) X∼B(1,p)X∼B(1,p) X\sim B(1,p) (II)(II)(II)伯努利试验,二项分布(离散型) X∼B(n,p)X∼B(n,p) ...
2019年上半年收集到的人工智能机器学习方向干货文章
2019年上半年收集到的人工智能机器学习方向干货文章 10种机器学习方法,掌握了就可以称霸朋友圈人工智能常见算法简介机器学习中的最优化算法总结最萌算法学习来啦,看不懂才怪! The Next S ...
只要掌握这三组公式，便可以在AI学习中如鱼得水了
本文摘录自百度AI 新手学习必备数学知识 ,为了便于查找和学习.主要包括有微积分.线性代数.概率与数理统计. 数学基础知识数据科学需要一定的数学基础,但仅仅做应用的话,如果时间不多,不用学太深,了 ...
matlab径向分布函数作图_常见的概率分布(matlab作图)
一.常见的概率分布表1.1 概率分布分类表连续随机变量分布连续统计量分布离散随机变量分布分布分布二项分布连续均匀分布非中心分布离散均匀分布 (Gamma)分布分布几何分布指 ...

随机变量，概率密度及其统计量

为何要引入随机变量

连续随机变量

概率密度函数

随机变量的统计量

随机变量，概率密度及其统计量相关推荐

最新文章

热门文章