在前面的文章里，已经带大伙了解了概率论的概率事件类型，以及针对某些事件的发生概率，以及针对全部场景的某事件的发生概率等基本知识。不过对于统计学专业来说，或者实际应用来说，接触最多的还是离散型和连续型概率，以及分析其概率密度与分布函数。所以说这里的内容可以算是概率论真正的支撑核心和基石。
无论你做数据分析，还是说人工智能方向，这是你应该打好的基础中的基础。

文章目录

离散型及连续型概率模型的基本定义
什么是概率模型的概率密度与概率分布函数
积分换元法与概率中的换元计算
一些相关例题
- 1. 离散型随机变量、分布函数
- 2. 离散型随机变量函数的分布
- 3. 连续型的概率密度、分布函数
- 4. 连续型随机变量函数的分布

离散型及连续型概率模型的基本定义

在研究生阶段，或者说在实际的工作阶段，经常可以看到关于连续和离散的讨论。我这里不想过多的讨论这个问题，只是简单的说一下，离散型，就相对于散数列，而连续型本质上是运动变化的连续描述。所以把数学上经常见到的两种不同类型的数据做到一张图表上，就是下面这个样子。

这是一张连续信号和离散信号的表达方式。对于概率来说，由于不存在 <0< 0<0 的情况，所以其各自的函数图就表现为：

那么根据概率的一般规律或者说属性，那就是针对定义域上的全部事件概率之和为1。那么对于离散型我们就可以知道，

F{X≤xrightmost}=P1+P2+P3+⋯+Pn=1F\left \{ X \leq x_{rightmost} \right \} = P_1 + P_2 + P_3 + \cdots + P_n = 1F{X≤xrightmost}=P1+P2+P3+⋯+Pn=1

即，把每个点的事件概率连续相加；而连续型，则是对函数图像求积分

F(x)=∫abf(x)dx=1F(x) = \int_{a}^{b} f(x) dx = 1F(x)=∫abf(x)dx=1

那么，一般在讨论到概率分布函数，即概率累计函数F(X)F(X)F(X) 的时候，我们在上面那个概率分布图画一个向左侧覆盖的框。

框里所覆盖的部分，就是对样本事件概率的加和，即：

F(X)=∑xk≤xPkF(X) = \sum_{x_k \leq x} P_kF(X)=xk≤x∑Pk

所以，从以上不难得出，如果样本覆盖覆盖范围，F(X<x0)F(X < x_0)F(X<x0) ，即F(X)F(X)F(X)取值范围不包括概率事件最左侧的样本概率，那么得出的累计概率(即分布函数)为0。

所以很容易求证出以下两条性质：

F(−∞)=0F(-\infty) = 0F(−∞)=0
F(+∞)=1F(+\infty) = 1F(+∞)=1

什么是概率模型的概率密度与概率分布函数

我个人不太喜欢从教科书的定义出发去理解概率密度与概率分布函数。既然它们的函数意义与微积分一样，那么不如直接从微积分的定义出发去理解函数的概率密度与概率分布更为方便。

通常提到概率密度，一般针对连续型的概率。我这里单刀直入，从概率分布函数（概率累加函数）的演算性质，它所对应的就是定积分概念里的求函数面积的过程。因此，从定积分的概念出发，很容易把概率的密度函数，和概率的分布函数统一到定积分里的导函数 f(x)f(x)f(x) 与原函数 F(X)F(X)F(X)这一概念里。

当然，对于连续型：

F(X)=∫abf(x)dxF(X) = \int_{a}^{b} f(x) dxF(X)=∫abf(x)dx

F(X)F(X)F(X) 是定积分里的原函数，也是概率里的分布函数
f(x)f(x)f(x) 是定积分里的导函数，也是概率里的概率密度函数

这样，我们把概念统一在一起后，对于理解离散型、连续型概率模型的概率密度与概率分布函数就显然简单太多了，因为我们可以把很多在定积分里，甚至不定积分里适用的工具全都拿到连续概率里，对我们来说无非求“面积/斜率”，显然这里用微积分工具明显更容易理解。

积分换元法与概率中的换元计算

直接看公式不是很容易理解，所以我也不是很理解国内的教科书为什么总喜欢跳过重要的基础知识点。这个，是连续型概率的重要知识点。所以我这里补充一些积分换元法的知识点，从而能让你从更为直观的角度理解概率论中连续型概率的换元运算背后的数学逻辑。

首先从链式法则出发，当一个函数是复合函数 (g∘f)(x)(g \circ f)(x)(g∘f)(x) 对它的求导，等于：

F(X)′=(g∘f)′(x)=g′(f(x))f′(x)F(X)' = (g \circ f)'(x) = g'(f(x))f'(x)F(X)′=(g∘f)′(x)=g′(f(x))f′(x)

所以针对复合函数的积分，也可以根据导数的链式法则进行扩展，于是有：

∫abF(X)′dX=∫αβg′(f(t))f′(t)dt\int_a^b F(X)' d X = \int_{\alpha}^{\beta} g'(f(t)) f'(t) dt∫abF(X)′dX=∫αβg′(f(t))f′(t)dt

只不过需要注意，就是积分项 dXdXdX 换到了 dtdtdt，所以导致了积分区域也会跟着一起发生改变。接着，然后我们换一种写法，令F′(X)=f(x)F'(X) = f(x)F′(X)=f(x), f(t)=φ(t)f(t) = \varphi(t)f(t)=φ(t)，于是得到了第二类积分换元法，

∫abf(x)dx=∫αβf[φ(t)]φ′(t)dt\int_a^b f(x) dx = \int_{\alpha}^{\beta} f[\varphi(t)] \varphi '(t) d t∫abf(x)dx=∫αβf[φ(t)]φ′(t)dt

这里并不难，难得是对数学符号的理解，你如果反应慢，建议多花点时间看一看，自己手动推导一遍看看。至于关键的 α\alphaα β\betaβ，应该取什么值的问题，这里用到的就是反函数的概念了，即：

φ(α)=a→α=φ−1(a)\varphi (\alpha) = a \rightarrow \alpha = \varphi^{-1}(a)φ(α)=a→α=φ−1(a)
φ(β)=b→β=φ−1(b)\varphi (\beta) = b \rightarrow \beta = \varphi^{-1}(b)φ(β)=b→β=φ−1(b)

然后，你再对比一下概率论里提到这部分的章节，是不是就理解了该死的概率换元公式，到底怎么得来的了吧。

fY(y)=fX(h(y))∣h′(y)∣f_Y(y) = f_X(h(y)) |h'(y)|fY(y)=fX(h(y))∣h′(y)∣

除了取绝对，其他简直一模一样。所以，你应该记住这里的概念，之后遇到类似的题目时，这些概念会成为我们解题的重要手段。

然后，跟其他章节里一样，我们来做点习题吧。

一些相关例题

1. 离散型随机变量、分布函数

盒中有6个球，其中4个白球，2个黑球，从中任取2个球，求：

（1）抽到白球数X的分布律

（2）随机变量X的分布函数

解（1）
所谓分布律，是指每一种样本的概率集合（Distribution），所以先分析白球的样本，X取值范围可以是：0，1，2
P{X=0}=C40C22C62=115P \left \{ X = 0 \right \} = \frac{C_4^0 C_2^2}{C_6^2} = \frac{1}{15}P{X=0}=C62C40C22=151
P{X=1}=C41C21C62=815P \left \{ X = 1 \right \} = \frac{C_4^1 C_2^1}{C_6^2} = \frac{8}{15}P{X=1}=C62C41C21=158
P{X=2}=C42C20C62=615P \left \{ X = 2 \right \} = \frac{C_4^2 C_2^0}{C_6^2} = \frac{6}{15}P{X=2}=C62C42C20=156

然后绘制样本概率表

X	0	1	2
P	1/15	8/15	6/15

解（2）
根据上题中的样本概率表，我们可以得出概率累加函数（或者说分布函数）

即：

F(X)={0x<01/150≤x<19/151≤x<212≤xF(X) = \left\{\begin{matrix} 0 & x < 0 \\ 1/15 & 0 \leq x < 1 \\ 9/15 & 1 \leq x < 2 \\ 1 & 2 \leq x \end{matrix}\right.F(X)=⎩⎪⎪⎨⎪⎪⎧01/159/151x<00≤x<11≤x<22≤x

这里的x并非取值范围。而是x处于坐标轴上什么位置，向左∑\sum∑的计算。即：

2. 离散型随机变量函数的分布

设随机变量X的分布律如下：

X -1 0 1 2

P 0.4 0.3 0.2 0.1

（1）U=X−1U = X - 1U=X−1 的分布律

（2）W=X2W = X^2W=X2 的分布律

解：

首先计算新分布函数的分布律，根据题目给出的公式，我们有：

P	0.4	0.3	0.2	0.1
X	-1	0	1	2
U	-2	-1	0	1
W	1	0	1	4

所以，我们可以根据上表，分别做出（1）和（2）的分布律

解（1）

U	-2	-1	0	1
P	0.4	0.3	0.2	0.1

解（2）

W	1	0	1	4
P	0.4	0.3	0.2	0.1

这里要稍微调整一下，于是有了：

W	0	1	4
P	0.3	0.6	0.1

3. 连续型的概率密度、分布函数

设连续型随机变量X的概率密度函数为 f(x)={a+x20≤x<10elsef(x) = \left\{\begin{matrix} a + x^2 & 0 \leq x < 1 \\ 0 & else \end{matrix}\right.f(x)={a+x200≤x<1else 求
(1). 常数 a
(2). P{X>=0.5}P \left \{ X >= 0.5 \right \}P{X>=0.5}
(3). 分布函数F(X)

解（1）

从概率密度函数的定义出发，我们有：

∫f(x)dx=1→∫elsef(x)dx+∫01(a+x2)dx=1\int f(x) dx = 1 \rightarrow \int_{else} f(x) dx + \int_0^1 (a+ x^2) dx = 1 ∫f(x)dx=1→∫elsef(x)dx+∫01(a+x2)dx=1

根据密度函数f(x)给出的条件，可以知道上式可以简化为：

∫01(a+x2)dx=1\int_0^1 (a+ x^2) dx = 1∫01(a+x2)dx=1

然后根据导积分的运算规则，获得原函数为：

∫01(a+x2)dx=(ax+13x3)∣01=1\int_0^1 (a+ x^2) dx = \left. (ax + \frac{1}{3} x^3) \right |_0^1 = 1∫01(a+x2)dx=(ax+31x3)∣∣∣∣01=1

代入上限和下限后，可以得到

a+13=1→a=23a+ \frac{1}{3} = 1 \rightarrow a = \frac{2}{3}a+31=1→a=32

解（2）
由于上面已经得到了 a=2/3，所以可以得到概率密度函数为：

f(x)={23+x20≤x<10elsef(x) = \left\{\begin{matrix} \frac{2}{3} + x^2 & 0 \leq x < 1 \\ 0 & else \end{matrix}\right.f(x)={32+x200≤x<1else

P{X>=0.5}P \left \{ X >= 0.5 \right \}P{X>=0.5} 即求解对于连续型概率，样本大于等于0.5后出现的事件概率，即对概率密度函数求积的过程。于是有：

P{X>=0.5}=∫0.5+∞f(x)dx=∫0.51f(x)dx+∫1∞f(x)dxP \left \{ X >= 0.5 \right \} = \int_{0.5}^{+\infty} f(x) dx = \int_{0.5}^{1} f(x) dx + \int_1^{\infty} f(x) dxP{X>=0.5}=∫0.5+∞f(x)dx=∫0.51f(x)dx+∫1∞f(x)dx

根据题干给出的条件，可以知道 ∫1∞f(x)dx=0\int_1^{\infty} f(x) dx = 0∫1∞f(x)dx=0，所以问题简化为：

P{X>=0.5}=∫0.51f(x)dx=∫0.51[23+x2]dxP \left \{ X >= 0.5 \right \} = \int_{0.5}^{1} f(x) dx =\int_{0.5}^{1} [\frac{2}{3} + x^2]dxP{X>=0.5}=∫0.51f(x)dx=∫0.51[32+x2]dx

然后根据导积分的运算规则，获得：

P{X>=0.5}=(23x+13x3)∣0.51=58P \left \{ X >= 0.5 \right \} = \left. (\frac{2}{3}x + \frac{1}{3} x^3) \right |_{0.5}^{1} = \frac{5}{8}P{X>=0.5}=(32x+31x3)∣∣∣∣0.51=85

解（3）

我们根据以上各题，可以轻易的得到分布函数F(X)为

F(X)={0x<023x+13x30≤x<111≤xF(X) = \left\{\begin{matrix} 0 & x < 0 \\ \frac{2}{3}x + \frac{1}{3} x^3 & 0 \leq x < 1 \\ 1 & 1 \leq x \end{matrix}\right.F(X)=⎩⎨⎧032x+31x31x<00≤x<11≤x

需要记住的是 F(X) 与 f(x) 是导数和原函数的关系。

4. 连续型随机变量函数的分布

设随机变量X的概率密度为 f(x)={x/80<x<40elsef(x) =\left\{\begin{matrix} x/8 & 0 < x < 4 \\ 0 & else \end{matrix}\right.f(x)={x/800<x<4else 求Y = 2X + 8的概率密度。

解

f(x) 是关于X的概率密度函数，所以要先得到关于X的分布函数，再更新Y的分布函数，然后对Y求导可以得到Y的密度函数，于是遵从这个思想，我们可以做如下解题过程。

（1）：先从X的密度函数出发，得到关于X的分布函数

Fx(X)={x2160<x<40elseF_x(X) =\left\{\begin{matrix} \frac{x^2}{16} & 0 < x < 4 \\ 0 & else \end{matrix}\right.Fx(X)={16x200<x<4else

（2）：从关于Y的分布函数出发，得到关于X的分布函数替代式： X = (Y - 8) / 2 然后带入到上面的公式去：

Fy(Y)={(Y−82)2/160<(Y−82)/16<40elseF_y(Y) = \left\{\begin{matrix} (\frac{Y- 8}{2})^2 / 16 & 0 < (\frac{Y- 8}{2}) / 16 < 4 \\ 0 & else \end{matrix}\right.Fy(Y)={(2Y−8)2/1600<(2Y−8)/16<4else

（3）：对上式化简一下：

Fy(Y)={(Y−82)2/168<Y<160elseF_y(Y) = \left\{\begin{matrix} (\frac{Y- 8}{2})^2 / 16 & 8 < Y < 16 \\ 0 & else \end{matrix}\right.Fy(Y)={(2Y−8)2/1608<Y<16else

（4）：对上式求导后，可以得到关于Y的概率密度函数。另外，由于Fy(Y)F_y(Y)Fy(Y)是复合函数，所以使用链式法则：

[(Y−82)2/16]′=216(Y−82)12=Y−832[(\frac{Y- 8}{2})^2 / 16]' = \frac{2}{16} (\frac{Y- 8}{2}) \frac{1}{2} = \frac{Y-8}{32}[(2Y−8)2/16]′=162(2Y−8)21=32Y−8

于是，

fy(Y)={Y−8328<Y<160elsef_y(Y) = \left\{\begin{matrix} \frac{Y-8}{32} & 8 < Y < 16 \\ 0 & else \end{matrix}\right.fy(Y)={32Y−808<Y<16else

这里你可以尝试使用一下公式法进行替代，不过我个人比较推荐从定义入手，毕竟这样不容易错。

概率论基础 —— 3.离散型、连续型概率模型，及其概率密度与概率分布函数相关推荐

概率论笔记4.3常见离散型和连续型的期望与方差
4.3常见离散型和连续型的期望与方差离散型 0-1分布二项分布推导时,np后面的那段式子其实是(p + q)^n,又因为 p + q == 1 所以EX = np 几何分布证明过程中使用了级数 ...
python 数学期望_数学期望（离散型和连续型）
数学期望的定义数学期望的计算公式例题 1.数学期望的定义在概率论和统计学中,数学期望(或均值)是试验中每次可能结果的概率乘以其结果的总和,是最基本的数学特征之一.它反映随机变量平均取值的大小. ...
统计学：离散型和连续型随机变量的概率分布
主要随机变量一览表随机变量概率分布均值方差一般离散型变量 p(x)的表.公式或者图p(x)的表.公式或者图 ∑xxp(x)\sum_{x}xp(x) ∑x(x−μ)2p(x)\sum_{x} ...
Dataset：数据生成之利用pandas自定义生成随机各自类型(离散型和连续型)的dataframe数据
Dataset:数据生成之利用pandas自定义生成随机各自类型(离散型和连续型)的dataframe数据目录数据生成之利用pandas自定义生成随机数据输出结果实现代码数据生成之利用pan ...
常见的离散型和连续型随机变量的概率分布
目录 1 基本概念 2 离散型随机变量的概率分布 2.1 二项分布 2.2 超几何分布 2.2.1 概念 2.2.2 举例 2.3 泊松分布 3 连续型随机变量的概率分布 3.1 均匀分布 3.1.1 ...
概率论基础 —— 5.离散型二维随机变量
在本系列前4章节,我们快速的过了一遍概率论对于一维随机变量的定义与分类. 从最原始直观的经典概率类型出发,我们引申到了条件概率,以及针对条件概率,扩展得到的全概率.贝叶斯概率. 在对概率建立起一定概念 ...
分类型变量预测连续型变量_概率论与数理统计之离散型和连续型随机变量知识点...
本文主要回顾复习了有关一维离散型.连续型随机变量及分布,以及相关性质.这一部分主要以选择题和填空题的形式出现在考研数学的试卷中,希望考研的考生多注意这一部分知识的复习,结合历年考研数学真题,争取早日掌 ...
【概率论】随机试验、随机变量、离散型/连续型随机变量
1. 随机试验满足以下3个条件的试验可以称为随机试验: 相同条件下可重复试验结果明确可知且不只一个试验前不知道哪个结果会发生例如:我们平时做的抛硬币.掷骰子试验都是随机试验.以抛硬币试验为例: ...
概率论(二)随机变量及其概率分布——离散和连续型随机变量及其分布函数
本节知识点 1.随机变量及其分布函数的定义 2.离散型随机变量定义:随机变量可能取得的值是有限个或者可列无限个概率分布列分布函数常见的离散性随机变量:0-1分布.二项分布和泊松分布 3.连续型 ...

概率论基础 —— 3.离散型、连续型概率模型，及其概率密度与概率分布函数