随机变量及其分布——《概率论与数理统计》第二章学习笔记

文章目录

随机变量及其分布——《概率论与数理统计》第二章学习笔记
- 前言
- Mindmap
- 一随机变量
- 二离散型随机变量及其分布律
- - 1. 离散型随机变量
  - 2. 分布律
  - - （0 - 1）分布
    - 伯努利试验、二项分布
    - - 二项分布
    - 泊松分布
    - - 泊松定理：
- 三随机变量的分布函数
- - 定义
  - - 基本性质
    - 离散型
    - 连续型
- 四连续型随机变量及其概率密度
- - 定义
  - - 概率密度的性质
  - 三种常见的连续型随机变量
  - - 1. 均匀分布
    - - 定义
      - 分布函数
    - 2. 指数分布
    - - 定义
      - 分布函数
      - 性质
    - 3. 正态分布
    - - 性质
      - 引理
      - 3σ法则
- 五随机变量的函数的分布
- - 定理
- 习题推荐
- - 2——细心
  - 10（2）——二项分布
  - 15——泊松定理
  - 24——指数分布+二项分布
  - 28——正态分布练手
  - 37——随机变量的函数
- 后话
- - 24——指数分布+二项分布
  - 28——正态分布练手
  - 37——随机变量的函数
- 后话

前言

之前搞了篇第一章的学习报告，这次决定一边学一边写报告，希望早点写完，冲冲冲！

参考的教材是《概率论与数理统计》浙大第五版。

Mindmap

一随机变量

定义：设随机试验的样本空间为 S = {e}. X = X(e) 是定义在样本空间S上的 实值单值函数 。称 X = X(e) 为随机变量。

类似于函数、映射的概念。

既然类似于函数，就有定义域和值域，通过定义知道，定义域为 样本空间 ，值域为 实数集。

即对随机事件 数量化。

二离散型随机变量及其分布律

1. 离散型随机变量

定义：全部可能取到的值是 有限个 或 可列无限多个 的随机变量。

这里有限一定可列，可列不一定无限。

而分布律的定义则是指： X取各个可能值的概率情况。

2. 分布律

教材中提及的离散型随机变量的分布律有三种，分别为0-1分布，二项分布（即n重伯努利分布）以及泊松分布。

（0 - 1）分布

即两点分布，随机变量X 只可能取 0 与 1 两个值。分布律表达式为
P{X=k}=pk(1−p)1−kk=0,1(0<p<1)P\{X=k\} = p^k(1-p)^{1-k} \qquad k=0,1 \qquad (0<p<1) P{X=k}=pk(1−p)1−kk=0,1(0<p<1)
上面的式子称 X 服从以p为参数的（0-1）分布或两点分布

伯努利试验、二项分布

和 0 1 分布类似。

伯努利试验：设试验E只有两个可能结果，A与非A。

设
P(A)=p(0<p<1),P(A‾)=1−pP(A) = p (0 < p < 1), P(\overline A) = 1- p P(A)=p(0<p<1),P(A)=1−p
将E独立重复进行n次，即为 n重伯努利试验。

这里的独立重复和第一章的一样，其实这个对应的二项分布我们在高中时期都有接触过。

二项分布

以X表示n重伯努利试验中事件A发生的次数，X的所有取值为k，0<= k <= n ，根据这个可以得到
P{X=k}=Cnkpk(1−p)n−kP \{X = k\} = C^k_n {p^k}{(1-p)^{n-k}} P{X=k}=Cnkpk(1−p)n−k
我们取 q = 1- p，则刚好是（p+q）^n 的展开式中p^k 项，称X服从参数为n，p的二项分布，记为 X~b(n, p).

特别地，当n取1时，记为0-1分布。

个人觉得例题的设备维修是一个不错的题目，可以去看看，会对二项分布有更深的了解。

泊松分布

设随机变量X所有可能取值为0，1，2，…，而取各个值的概率
P{X=k}=λke−λk!,k=0,1,2,...,P \{X = k \} = \frac{\lambda ^k e^{-\lambda}}{k!}, k = 0,1,2,..., P{X=k}=k!λke−λ,k=0,1,2,...,
其中 λ > 0是常数，则称X服从参数为 λ 的 泊松分布，记为
X∼π(λ)X \sim \pi(\lambda) X∼π(λ)
泊松分布可以用来逼近二项分布，因为二项分布虽然规律性很强，也有比较好的准确性，但是计算的复杂度太高，所以往往会使用泊松分布来逼近。

泊松定理：

设 λ ＞ 0 是一个常数，n是任意正整数，设
npn=λnp_n = λ npn=λ
则对于任一固定的非负整数k，有
lim⁡n→∞Cnkpnk(1−pn)n−k=λke−kk!\lim_{n\rightarrow \infty}C^k_n{p^k_n(1-p_n)^{n-k}} = \frac{\lambda^k e^{-k}}{k!} n→∞limCnkpnk(1−pn)n−k=k!λke−k
这里的证明我不写了，可以直接看课本，顺带回忆一下高等数学。

三随机变量的分布函数

分布函数的提出是因为在某些情况下，随机变量取实数域上的一点的概率是困难且无意义，这里点名连续型随机变量，因此改为选取区间的概率。区间一般以左开右闭的形式。

定义

设 X 是一个随机变量，x是任意实数，函数
F(x)=P{X≤x},−∞<x<∞F(x) = P\{X \leq x \}, -\infty < x < \infty F(x)=P{X≤x},−∞<x<∞
称为 X 的分布函数。

而对于任意实数x1, x2 (x1 < x2) 有
P{x1<X≤x2}=P{X≤x2}−P{X≤x1}=F(x2)−F(x1)P\{ x_1 < X \leq x_2 \} = P \{ X\leq x_2 \} - P\{X \leq x_1 \} = F(x_2) - F(x_1) P{x1<X≤x2}=P{X≤x2}−P{X≤x1}=F(x2)−F(x1)
所以，如果已知X的分布函数，就可以知道X落在任意区间上的概率，这种由点到区间段的进步，也更加方便我们研究概率，同时也更完整地描述随机变量的统计规律性。

基本性质

分布函数F（x）具有以下性质

F(x) 是一个不减函数。即，对于任意实数 x1, x2 (x1 < x2) 有
F(x2)−F(x1)=P{x1<X≤x2}≥0.F(x_2) - F(x_1) = P \{x_1 < X \leq x_2 \} \geq 0. \\ \\ F(x2)−F(x1)=P{x1<X≤x2}≥0.
0≤F(x)≤1且F(−∞)=lim⁡x→−∞F(x)=0F(∞)=lim⁡x→∞F(x)=1.0 \leq F(x) \leq 1 且 \\ F(-\infty) = \lim_{x \rightarrow -\infty}{F(x)} = 0 \\ F(\infty) = \lim_{x \rightarrow \infty}{F(x)} = 1. \\ 0≤F(x)≤1且F(−∞)=x→−∞limF(x)=0F(∞)=x→∞limF(x)=1.
F(x+0)=F(x),即F(x)是右连续的。F(x + 0) = F(x), 即F(x) 是右连续的。 F(x+0)=F(x),即F(x)是右连续的。

简单概括就是单调不减，累积非负，右连续。

所以结合定义和性质可知：分布函数其实是一种累积概率，有点类似于算法中的前缀和。

通过课本中的两道例题，我们可以知道对于离散型和连续型的分布函数的使用。

离散型

一般，设离散型随机变量X的分布律为
P{X=xk}=pk,k=1,2,...P\{X=x_k \} = p_k, k = 1,2,... P{X=xk}=pk,k=1,2,...
由概率的可列可加性，得
F(x)=P{X≤x}=∑xk≤xP{X=xk},即F(x)=∑xk≤xpkF(x) = P \{X\leq x \} = \sum_{x_k \leq x}{P\{X=x_k \}}, \\ 即 \qquad \qquad \qquad F(x) = \sum_{x_k \leq x}{p_k} F(x)=P{X≤x}=xk≤x∑P{X=xk},即F(x)=xk≤x∑pk
对于离散型，分布函数作为一个累积函数，会存在跳跃，不难发现：跳跃值即为该点的概率值

连续型

设f(x) 为随机变量的概率密度，有
KaTeX parse error: No such environment: equation* at position 15: F(x) = \begin{̲e̲q̲u̲a̲t̲i̲o̲n̲*̲}̲ \int_{-\inft…

四连续型随机变量及其概率密度

定义

对于随机变量X的分布函数 F(x), 存在非负可积函数 f(x), 使对于任意实数x有
KaTeX parse error: No such environment: equation* at position 15: F(x) = \begin{̲e̲q̲u̲a̲t̲i̲o̲n̲*̲}̲ \int_{-\inft…
称 X 为连续随机变量，f(x) 为 X 的概率密度函数，简称概率密度。

由高数关于积分和微分的定义及性质知道，如果原函数即分布函数连续，则概率密度函数也连续。

概率密度的性质

f(x) \geq 0 \
\begin{equation*}
\int_{-\infty}^{+\infty} f(x)dx
\end{equation*} = 1
$$

KaTeX parse error: No such environment: equation* at position 89: …(x_1) = \begin{̲e̲q̲u̲a̲t̲i̲o̲n̲*̲}̲ \int_{x_1}^{…

KaTeX parse error: No such environment: equation* at position 76: … G(x) = \begin{̲e̲q̲u̲a̲t̲i̲o̲n̲*̲}̲ \int_{-\inf…

它是某一随机变量X的分布函数，f(x) 是 X 的概率密度。

而我们结合定义知道，对于区间上任一点的概率为0，但是该点不一定是不可能事件。所以不可能事件是该事件的概率是0的 充分不必要条件。

三种常见的连续型随机变量

主要用它们的概率密度来描述。

1. 均匀分布

定义

若连续型随机变量X具有概率密度
KaTeX parse error: Undefined control sequence: \ at position 110: …igned} \right. \̲ ̲
则称X在区间（a，b）上服从 均匀分布，记为 X~U（a，b）。

在a到b的区间上，随机变量落在任一点的概率是等同的，落在(a, b)的子区间内的概率只与子区间的长度有关，与子区间的位置无关。

分布函数

可以假设子区间长度为l，子区间为(c, c+l)，a <= c < c + l <= b, 有
KaTeX parse error: No such environment: equation* at position 30: … +l \} = \begin{̲e̲q̲u̲a̲t̲i̲o̲n̲*̲}̲ \int_{c}^{c …
所以就可以得到分布函数
KaTeX parse error: Undefined control sequence: \ at position 153: …igned} \right. \̲ ̲

2. 指数分布

定义

若连续型随机变量X的概率密度为
f(x)={1θe−x/θ,x>0,0,其他.θ>0，为常数则称X服从参数为θ的指数分布。f(x) = \left\{ \begin{aligned} \frac{1}{\theta}e^{-x/\theta}, x > 0, \\ 0, \qquad \quad 其他. \end{aligned} \right. \\ \theta > 0，为常数则称 X 服从参数为\theta 的指数分布。 f(x)=⎩⎨⎧θ1e−x/θ,x>0,0,其他.θ>0，为常数则称X服从参数为θ的指数分布。

分布函数

我们对f（x）积分即可得到分布函数
KaTeX parse error: Undefined control sequence: \ at position 103: …gned} \right. \̲ ̲

性质

任意s, t > 0, 有
P{X>s+t∣X>s}=P{X>t}.P\{X > s + t | X > s\} = P\{X > t\}. P{X>s+t∣X>s}=P{X>t}.
这种性质称为 无记忆性。

指数分布在可靠性理论与排队论中有广泛的应用。

3. 正态分布

若连续型随机变量X的概率密度为
f(x)=12πσe−(x−u)22σ2,−∞<x<∞其中μ,σ(σ>0)为常数，则称X服从参数为μ,σf(x) = \frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-u)^2}{2\sigma^2}}, \qquad -\infty < x < \infty \\ 其中 \mu,\sigma(\sigma>0)为常数，则称X服从参数为 \mu, \sigma f(x)=2πσ1e−2σ2(x−u)2,−∞<x<∞其中μ,σ(σ>0)为常数，则称X服从参数为μ,σ
的 正态分布或 高斯分布，记为
X∼N(μ,σ2).X\sim N(\mu, \sigma^2). X∼N(μ,σ2).

性质

f(x) 的曲线具有以下性质：

曲线关于x = μ 对称。这表明对于任意 h > 0 有
p{μ−h<X≤μ}=P{μ<X≤μ+h}p \{μ-h < X \leq μ \} = P \{μ< X\leq μ+h \} p{μ−h<X≤μ}=P{μ<X≤μ+h}
当 x = μ时取到最大值
f(μ)=12πσ.f(\mu) = \frac{1}{\sqrt{2\pi}\sigma}. f(μ)=2πσ1.
x 离 μ越远，f（x）的值越小。这表明对于同样长度的区间，当区间离μ越远时，X落在这个区间上的概率越小。

特别地，当μ = 0时，σ=1时称随机变量 X 服从 标准正态分布。其概率函数和概率密度函数分别用 φ（x）和 Φ（x）表示。

引理

若随机变量 X~N（μ，σ^2）, 则
Z=X−μσ∼N(0,1).Z = \frac{X-\mu}{\sigma} \sim N(0, 1). Z=σX−μ∼N(0,1).
这个引理表明，我们对一个一般的正态分布通过简单的线性变换转换成一个标准正态分布。

3σ法则

这里不写法则内容，只谈一下在数据处理时的应用，可以用于剔除异常值。

五随机变量的函数的分布

例题直接看就行，蛮容易懂的。

关于连续型随机变量的函数有下述定理。

定理

设随机变量X具有概率密度
fX(x),−∞<y<∞f_X(x), \\ -\infty < y < \infty fX(x),−∞<y<∞
又设函数 g(x) 处处可导且恒有 g’(x) > 0 (或恒有 g’(x) < 0), 则 Y=g(X) 是连续随机变量，概率密度为：
fY(y)={fX[h(y)]∣h′(y)∣,α<y<β,0,其他f_Y(y) = \left\{ \begin{aligned} f_X[h(y)]|h'(y)|, \qquad \alpha < y < \beta, \\ 0, \qquad \qquad \qquad \qquad \qquad 其他 \end{aligned} \right. fY(y)={fX[h(y)]∣h′(y)∣,α<y<β,0,其他
其中 α = min{g(-∞)， g(∞)}，β = max{g(-∞)， g(∞)}，h(y) 是 g(x) 的反函数。

习题推荐

简单的刷了下后面的习题，做了一个推荐题单。

感兴趣的可以去看看，下列会写一下思路，不写具体答案和解析过程，毕竟都能查到。

2——细心

一个是取球，一个是摇骰子，其实这种题目容易被误认为二项分布，但是二项分布是建立在独立重复的情况下，所以在分析需要判断是否是独立的情况。

显然，取球并不是，而摇骰子题目我们需要判断由于是两个骰子，要求最小的点数，我们需要分别考虑以一个骰子为最小和等同的情况。

10（2）——二项分布

这题其实是问这个人是猜的还是他自己确实牛逼，可以品出来，我们需要使用二项分布计算出他10次对3次的概率，然后我们会发现这个值很小，所以说明他确实nb。

15——泊松定理

这题其实如果没有提示，可能很多人都会用二项分布去做，然后发现这个值很难算，因为其实就转换成
P{X≤10}P\{X \leq 10 \} P{X≤10}
X 为死亡人数，然后5000人投保，显然数字差的很大，我们可以使用泊松定理去使用泊松分布近似，当然最重要的是泊松分布可以使用查表求得。

24——指数分布+二项分布

其实这道题课上讲过，但我还是推荐，因为确实经典。

我们使用指数分布的概率密度积分得到分布函数，P{X > 10}

利用这个概率，假设p，即可使用二项分布计算结果。

28——正态分布练手

就一道纯纯的练手题，使用正态分布即可，当然这里会使用到查表。

37——随机变量的函数

其实就是需要熟悉这种题目的过程，仿造第五节的例三，例四即可。

不过这题不用积分，求导就可以了。

后话

第二章就到这里啦，还挺久的。

溜了，去打数竞的题目，有机会的话，可以做一个数竞高数的专题系列blog。
这题其实如果没有提示，可能很多人都会用二项分布去做，然后发现这个值很难算，因为其实就转换成
P{X≤10}P\{X \leq 10 \} P{X≤10}
X 为死亡人数，然后5000人投保，显然数字差的很大，我们可以使用泊松定理去使用泊松分布近似，当然最重要的是泊松分布可以使用查表求得。

24——指数分布+二项分布

其实这道题课上讲过，但我还是推荐，因为确实经典。

我们使用指数分布的概率密度积分得到分布函数，P{X > 10}

利用这个概率，假设p，即可使用二项分布计算结果。

28——正态分布练手

就一道纯纯的练手题，使用正态分布即可，当然这里会使用到查表。

37——随机变量的函数

其实就是需要熟悉这种题目的过程，仿造第五节的例三，例四即可。

不过这题不用积分，求导就可以了。

后话

第二章就到这里啦，还挺久的。

溜了，去打数竞的题目，有机会的话，可以做一个数竞高数的专题系列blog。

【超详细】随机变量及其分布——《概率论与数理统计》第二章学习笔记相关推荐

2021-08-08概率论与数理统计-第二章
文章目录概率论与数理统计-第二章概率论与数理统计-第二章
概率论与数理统计——高斯分布的学习笔记
1 高斯分布的数学定义高斯分布的定义来自<概率论与数理统计·浙江大学>:
多维随机变量及其分布——《概率论及其数理统计》第三章学习笔记
多维随机变量及其分布--<概率论及其数理统计>第三章学习笔记文章目录多维随机变量及其分布--<概率论及其数理统计>第三章学习笔记前言 MindMap 二维随机变量定义与 ...
概率论与数理统计(第二版) 吴传生编高等教育出版社大学课后习题答案
概率论与数理统计(第二版) 吴传生编高等教育出版社第1章:随机事件的概率第2章:一维随机变量及其分布第3章:多维随机变量及其分布第4章:随机变量的数字特征第5章:大数定律和中心极限定律 ...
[概统]本科二年级概率论与数理统计第二讲几何概型
[概统]本科二年级概率论与数理统计第二讲几何概型蒲丰投针问题 Buffon's Needle Problem 伯川德悖论 Bertrand Paradox 几何概型的思想非常简单,用图形表示事 ...
王式安概率论与数理统计基础课手写笔记-第一章概率与事件-第二章随机变量及其分布
写在前面:做题还是要做的,但是课本上基础理论不能忘,比如每章前言,告知本章研究的内容及研究的方法.走过的路都算数. 文章目录第一章概率与事件第二章随机变量及其分布第一章概率与事件第二章 ...
郝志峰《概率论与数理统计》期末复习笔记
目录前言第一章概率论的基础概念知识大纲随机试验随机事件事件概率等可能概率模型第二章概率论的基本定理知识大纲条件概率独立性全概率公式贝叶斯公式 ...
《概率论与数理统计》再学习之事件的互斥（互不相容）和独立的关系
前言事件的互不相容性和独立性,在学习的时候突然觉得这两者之间总是存在是若即若离的关系,一时间不知道怎么去归纳总结好.一直找了很多信息来看,那么究竟应该怎么去区别或者什么时候使用比较好呢? 问题互不 ...
超详细的计算机网络基础知识总结第三章：数据链路层
本文基于:王道计算机考研-计算机网络其他文章: 超详细的计算机网络基础知识第一章:概述超详细的计算机网络基础知识第二章:物理层超详细的计算机网络基础知识第四章:数据链路层超详细的计算机网 ...
超详细的计算机网络基础知识总结第四章：网络层
本文基于:王道计算机考研-计算机网络 ☺其他文章: 超详细的计算机网络基础知识第一章:概述超详细的计算机网络基础知识第二章:物理层超详细的计算机网络基础知识第三章:数据链路层超详细的计算机 ...

【超详细】随机变量及其分布——《概率论与数理统计》第二章学习笔记

随机变量及其分布——《概率论与数理统计》第二章学习笔记

文章目录

前言

Mindmap

一 随机变量

二 离散型随机变量及其分布律

1. 离散型随机变量

2. 分布律

（0 - 1）分布

伯努利试验、二项分布

二项分布

泊松分布

泊松定理：

三 随机变量的分布函数

定义

基本性质

离散型

连续型

四 连续型随机变量及其概率密度

定义

概率密度的性质

三种常见的连续型随机变量

1. 均匀分布

定义

分布函数

2. 指数分布

定义

分布函数

性质

3. 正态分布

性质

引理

3σ法则

五 随机变量的函数的分布

定理

习题推荐

2——细心

10（2）——二项分布

15——泊松定理

24——指数分布+二项分布

28——正态分布 练手

37——随机变量的函数

后话

24——指数分布+二项分布

28——正态分布 练手

37——随机变量的函数

后话

【超详细】随机变量及其分布——《概率论与数理统计》第二章学习笔记相关推荐

最新文章

热门文章

一随机变量

二离散型随机变量及其分布律

三随机变量的分布函数

四连续型随机变量及其概率密度

五随机变量的函数的分布

28——正态分布练手

28——正态分布练手