【超详细】随机变量及其分布——《概率论与数理统计》第二章学习笔记
随机变量及其分布——《概率论与数理统计》第二章学习笔记
文章目录
- 随机变量及其分布——《概率论与数理统计》第二章学习笔记
- 前言
- Mindmap
- 一 随机变量
- 二 离散型随机变量及其分布律
- 1. 离散型随机变量
- 2. 分布律
- (0 - 1)分布
- 伯努利试验、二项分布
- 二项分布
- 泊松分布
- 泊松定理:
- 三 随机变量的分布函数
- 定义
- 基本性质
- 离散型
- 连续型
- 四 连续型随机变量及其概率密度
- 定义
- 概率密度的性质
- 三种常见的连续型随机变量
- 1. 均匀分布
- 定义
- 分布函数
- 2. 指数分布
- 定义
- 分布函数
- 性质
- 3. 正态分布
- 性质
- 引理
- 3σ法则
- 五 随机变量的函数的分布
- 定理
- 习题推荐
- 2——细心
- 10(2)——二项分布
- 15——泊松定理
- 24——指数分布+二项分布
- 28——正态分布 练手
- 37——随机变量的函数
- 后话
- 24——指数分布+二项分布
- 28——正态分布 练手
- 37——随机变量的函数
- 后话
前言
之前搞了篇第一章的学习报告,这次决定一边学一边写报告,希望早点写完,冲冲冲!
参考的教材是《概率论与数理统计》浙大第五版。
Mindmap
一 随机变量
定义:设随机试验的样本空间为 S = {e}. X = X(e) 是定义在样本空间S上的 实值单值函数 。称 X = X(e) 为随机变量。
类似于函数、映射的概念。
既然类似于函数,就有定义域和值域,通过定义知道,定义域为 样本空间 ,值域为 实数集。
即对随机事件 数量化。
二 离散型随机变量及其分布律
1. 离散型随机变量
定义:全部可能取到的值是 有限个 或 可列无限多个 的随机变量。
这里 有限一定可列,可列不一定无限。
而分布律的定义则是指: X取各个可能值的概率情况。
2. 分布律
教材中提及的离散型随机变量的分布律有三种,分别为0-1分布,二项分布(即n重伯努利分布)以及 泊松分布。
(0 - 1)分布
即两点分布,随机变量X 只可能取 0 与 1 两个值。分布律表达式为
P{X=k}=pk(1−p)1−kk=0,1(0<p<1)P\{X=k\} = p^k(1-p)^{1-k} \qquad k=0,1 \qquad (0<p<1) P{X=k}=pk(1−p)1−kk=0,1(0<p<1)
上面的式子 称 X 服从以p为参数的 (0-1)分布或两点分布
伯努利试验、二项分布
和 0 1 分布类似。
伯努利试验:设试验E只有两个可能结果,A与非A。
设
P(A)=p(0<p<1),P(A‾)=1−pP(A) = p (0 < p < 1), P(\overline A) = 1- p P(A)=p(0<p<1),P(A)=1−p
将E独立重复进行n次,即为 n重伯努利试验。
这里的独立重复和第一章的一样,其实这个对应的二项分布我们在高中时期都有接触过。
二项分布
以X表示n重伯努利试验中事件A发生的次数,X的所有取值为k,0<= k <= n ,根据这个可以得到
P{X=k}=Cnkpk(1−p)n−kP \{X = k\} = C^k_n {p^k}{(1-p)^{n-k}} P{X=k}=Cnkpk(1−p)n−k
我们取 q = 1- p,则刚好是(p+q)^n 的展开式中p^k 项,称X服从参数为n,p的二项分布,记为 X~b(n, p).
特别地,当n取1时,记为0-1分布。
个人觉得例题的设备维修是一个不错的题目,可以去看看,会对二项分布有更深的了解。
泊松分布
设随机变量X所有可能取值为0,1,2,…,而取各个值的概率
P{X=k}=λke−λk!,k=0,1,2,...,P \{X = k \} = \frac{\lambda ^k e^{-\lambda}}{k!}, k = 0,1,2,..., P{X=k}=k!λke−λ,k=0,1,2,...,
其中 λ > 0是 常数,则称X服从参数为 λ 的 泊松分布,记为
X∼π(λ)X \sim \pi(\lambda) X∼π(λ)
泊松分布可以用来逼近二项分布,因为二项分布虽然规律性很强,也有比较好的准确性,但是计算的复杂度太高,所以往往会使用泊松分布来逼近。
泊松定理:
设 λ > 0 是一个常数,n是任意正整数,设
npn=λnp_n = λ npn=λ
则对于任一固定的非负整数k,有
limn→∞Cnkpnk(1−pn)n−k=λke−kk!\lim_{n\rightarrow \infty}C^k_n{p^k_n(1-p_n)^{n-k}} = \frac{\lambda^k e^{-k}}{k!} n→∞limCnkpnk(1−pn)n−k=k!λke−k
这里的证明我不写了,可以直接看课本,顺带回忆一下高等数学。
三 随机变量的分布函数
分布函数的提出是因为在某些情况下,随机变量取实数域上的一点的概率是困难且无意义,这里点名连续型随机变量,因此改为选取区间的概率。区间一般以左开右闭的形式。
定义
设 X 是一个随机变量,x是任意实数,函数
F(x)=P{X≤x},−∞<x<∞F(x) = P\{X \leq x \}, -\infty < x < \infty F(x)=P{X≤x},−∞<x<∞
称为 X 的分布函数。
而对于任意实数x1, x2 (x1 < x2) 有
P{x1<X≤x2}=P{X≤x2}−P{X≤x1}=F(x2)−F(x1)P\{ x_1 < X \leq x_2 \} = P \{ X\leq x_2 \} - P\{X \leq x_1 \} = F(x_2) - F(x_1) P{x1<X≤x2}=P{X≤x2}−P{X≤x1}=F(x2)−F(x1)
所以,如果已知X的分布函数,就可以知道X落在任意区间上的概率,这种 由 点到区间段的进步,也更加方便我们研究概率,同时也更完整地描述随机变量的统计规律性。
基本性质
分布函数F(x) 具有以下性质
F(x) 是一个不减函数。即,对于任意实数 x1, x2 (x1 < x2) 有
F(x2)−F(x1)=P{x1<X≤x2}≥0.F(x_2) - F(x_1) = P \{x_1 < X \leq x_2 \} \geq 0. \\ \\ F(x2)−F(x1)=P{x1<X≤x2}≥0.0≤F(x)≤1且F(−∞)=limx→−∞F(x)=0F(∞)=limx→∞F(x)=1.0 \leq F(x) \leq 1 且 \\ F(-\infty) = \lim_{x \rightarrow -\infty}{F(x)} = 0 \\ F(\infty) = \lim_{x \rightarrow \infty}{F(x)} = 1. \\ 0≤F(x)≤1且F(−∞)=x→−∞limF(x)=0F(∞)=x→∞limF(x)=1.
F(x+0)=F(x),即F(x)是右连续的。F(x + 0) = F(x), 即F(x) 是右连续的。 F(x+0)=F(x),即F(x)是右连续的。
简单概括就是 单调不减,累积非负,右连续。
所以结合定义和性质可知:分布函数其实是一种累积概率,有点类似于算法中的前缀和。
通过课本中的两道例题,我们可以知道对于离散型和连续型的分布函数的使用。
离散型
一般,设离散型随机变量X的分布律为
P{X=xk}=pk,k=1,2,...P\{X=x_k \} = p_k, k = 1,2,... P{X=xk}=pk,k=1,2,...
由概率的可列可加性,得
F(x)=P{X≤x}=∑xk≤xP{X=xk},即F(x)=∑xk≤xpkF(x) = P \{X\leq x \} = \sum_{x_k \leq x}{P\{X=x_k \}}, \\ 即 \qquad \qquad \qquad F(x) = \sum_{x_k \leq x}{p_k} F(x)=P{X≤x}=xk≤x∑P{X=xk},即F(x)=xk≤x∑pk
对于离散型,分布函数作为一个累积函数,会存在跳跃,不难发现:跳跃值即为该点的概率值
连续型
设f(x) 为 随机变量的概率密度,有
KaTeX parse error: No such environment: equation* at position 15: F(x) = \begin{̲e̲q̲u̲a̲t̲i̲o̲n̲*̲}̲ \int_{-\inft…
四 连续型随机变量及其概率密度
定义
对于随机变量X的分布函数 F(x), 存在非负可积函数 f(x), 使对于任意实数x有
KaTeX parse error: No such environment: equation* at position 15: F(x) = \begin{̲e̲q̲u̲a̲t̲i̲o̲n̲*̲}̲ \int_{-\inft…
称 X 为连续随机变量,f(x) 为 X 的概率密度函数,简称概率密度。
由高数关于积分和微分的定义及性质知道,如果原函数即分布函数连续,则概率密度函数也连续。
概率密度的性质
$$
- f(x) \geq 0 \
- \begin{equation*}
\int_{-\infty}^{+\infty} f(x)dx
\end{equation*} = 1
$$
KaTeX parse error: No such environment: equation* at position 89: …(x_1) = \begin{̲e̲q̲u̲a̲t̲i̲o̲n̲*̲}̲ \int_{x_1}^{…
KaTeX parse error: No such environment: equation* at position 76: … G(x) = \begin{̲e̲q̲u̲a̲t̲i̲o̲n̲*̲}̲ \int_{-\inf…
它是某一随机变量X的分布函数,f(x) 是 X 的概率密度。
而我们结合定义知道,对于区间上任一点的概率为0,但是该点不一定是不可能事件。所以不可能事件是该事件的概率是0的 充分不必要条件。
三种常见的连续型随机变量
主要用它们的概率密度来描述。
1. 均匀分布
定义
若连续型随机变量X具有概率密度
KaTeX parse error: Undefined control sequence: \ at position 110: …igned} \right. \̲ ̲
则称X在区间(a,b)上服从 均匀分布,记为 X~U(a,b)。
在a到b的区间上,随机变量落在任一点的概率是等同的,落在(a, b)的子区间内的概率只与子区间的长度有关,与子区间的位置无关。
分布函数
可以假设子区间长度为l,子区间为(c, c+l),a <= c < c + l <= b, 有
KaTeX parse error: No such environment: equation* at position 30: … +l \} = \begin{̲e̲q̲u̲a̲t̲i̲o̲n̲*̲}̲ \int_{c}^{c …
所以就可以得到分布函数
KaTeX parse error: Undefined control sequence: \ at position 153: …igned} \right. \̲ ̲
2. 指数分布
定义
若连续型随机变量X的概率密度为
f(x)={1θe−x/θ,x>0,0,其他.θ>0,为常数则称X服从参数为θ的指数分布。f(x) = \left\{ \begin{aligned} \frac{1}{\theta}e^{-x/\theta}, x > 0, \\ 0, \qquad \quad 其他. \end{aligned} \right. \\ \theta > 0,为常数则称 X 服从参数为\theta 的指数分布。 f(x)=⎩⎨⎧θ1e−x/θ,x>0,0,其他.θ>0,为常数则称X服从参数为θ的指数分布。
分布函数
我们对f(x)积分即可得到分布函数
KaTeX parse error: Undefined control sequence: \ at position 103: …gned} \right. \̲ ̲
性质
任意s, t > 0, 有
P{X>s+t∣X>s}=P{X>t}.P\{X > s + t | X > s\} = P\{X > t\}. P{X>s+t∣X>s}=P{X>t}.
这种性质称为 无记忆性。
指数分布在可靠性理论与排队论中有广泛的应用。
3. 正态分布
若连续型随机变量X的概率密度为
f(x)=12πσe−(x−u)22σ2,−∞<x<∞其中μ,σ(σ>0)为常数,则称X服从参数为μ,σf(x) = \frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-u)^2}{2\sigma^2}}, \qquad -\infty < x < \infty \\ 其中 \mu,\sigma(\sigma>0)为常数,则称X服从参数为 \mu, \sigma f(x)=2πσ1e−2σ2(x−u)2,−∞<x<∞其中μ,σ(σ>0)为常数,则称X服从参数为μ,σ
的 正态分布或 高斯分布,记为
X∼N(μ,σ2).X\sim N(\mu, \sigma^2). X∼N(μ,σ2).
性质
f(x) 的曲线具有以下性质:
曲线关于x = μ 对称。这表明对于任意 h > 0 有
p{μ−h<X≤μ}=P{μ<X≤μ+h}p \{μ-h < X \leq μ \} = P \{μ< X\leq μ+h \} p{μ−h<X≤μ}=P{μ<X≤μ+h}当 x = μ时 取到最大值
f(μ)=12πσ.f(\mu) = \frac{1}{\sqrt{2\pi}\sigma}. f(μ)=2πσ1.
x 离 μ越远,f(x)的值越小。这表明对于同样长度的区间,当区间离μ越远时,X落在这个区间上的概率越小。
特别地,当μ = 0时,σ=1时 称随机变量 X 服从 标准正态分布。其概率函数和概率密度函数分别用 φ(x)和 Φ(x)表示。
引理
若随机变量 X~N(μ,σ^2), 则
Z=X−μσ∼N(0,1).Z = \frac{X-\mu}{\sigma} \sim N(0, 1). Z=σX−μ∼N(0,1).
这个引理表明,我们对一个一般的正态分布通过简单的线性变换转换成一个标准正态分布。
3σ法则
这里不写法则内容,只谈一下在数据处理时的应用,可以用于剔除异常值。
五 随机变量的函数的分布
例题直接看就行,蛮容易懂的。
关于连续型随机变量的函数有下述定理。
定理
设随机变量X具有概率密度
fX(x),−∞<y<∞f_X(x), \\ -\infty < y < \infty fX(x),−∞<y<∞
又设函数 g(x) 处处可导且恒有 g’(x) > 0 (或恒有 g’(x) < 0), 则 Y=g(X) 是连续随机变量,概率密度为:
fY(y)={fX[h(y)]∣h′(y)∣,α<y<β,0,其他f_Y(y) = \left\{ \begin{aligned} f_X[h(y)]|h'(y)|, \qquad \alpha < y < \beta, \\ 0, \qquad \qquad \qquad \qquad \qquad 其他 \end{aligned} \right. fY(y)={fX[h(y)]∣h′(y)∣,α<y<β,0,其他
其中 α = min{g(-∞), g(∞)},β = max{g(-∞), g(∞)},h(y) 是 g(x) 的反函数。
习题推荐
简单的刷了下后面的习题,做了一个推荐题单。
感兴趣的可以去看看,下列会写一下思路,不写具体答案和解析过程,毕竟都能查到。
2——细心
一个是取球,一个是摇骰子,其实这种题目容易被误认为二项分布,但是二项分布是建立在独立重复的情况下,所以在分析需要判断是否是独立的情况。
显然,取球并不是,而摇骰子题目我们需要判断由于是两个骰子,要求最小的点数,我们需要分别考虑以一个骰子为最小和等同的情况。
10(2)——二项分布
这题其实是问这个人是猜的还是他自己确实牛逼,可以品出来,我们需要使用二项分布计算出他10次对3次的概率,然后我们会发现这个值很小,所以说明他确实nb。
15——泊松定理
这题其实如果没有提示,可能很多人都会用二项分布去做,然后发现这个值很难算,因为其实就转换成
P{X≤10}P\{X \leq 10 \} P{X≤10}
X 为 死亡人数,然后5000人投保,显然数字差的很大,我们可以使用泊松定理去使用泊松分布近似,当然最重要的是泊松分布可以使用查表求得。
24——指数分布+二项分布
其实这道题课上讲过,但我还是推荐,因为确实经典。
我们使用指数分布的概率密度积分得到分布函数,P{X > 10}
利用这个概率,假设p,即可使用二项分布计算结果。
28——正态分布 练手
就一道纯纯的练手题,使用正态分布即可,当然这里会使用到查表。
37——随机变量的函数
其实就是需要熟悉这种题目的过程,仿造第五节的例三,例四即可。
不过这题不用积分,求导就可以了。
后话
第二章就到这里啦,还挺久的。
溜了,去打数竞的题目,有机会的话,可以做一个数竞高数的专题系列blog。
这题其实如果没有提示,可能很多人都会用二项分布去做,然后发现这个值很难算,因为其实就转换成
P{X≤10}P\{X \leq 10 \} P{X≤10}
X 为 死亡人数,然后5000人投保,显然数字差的很大,我们可以使用泊松定理去使用泊松分布近似,当然最重要的是泊松分布可以使用查表求得。
24——指数分布+二项分布
其实这道题课上讲过,但我还是推荐,因为确实经典。
我们使用指数分布的概率密度积分得到分布函数,P{X > 10}
利用这个概率,假设p,即可使用二项分布计算结果。
28——正态分布 练手
就一道纯纯的练手题,使用正态分布即可,当然这里会使用到查表。
37——随机变量的函数
其实就是需要熟悉这种题目的过程,仿造第五节的例三,例四即可。
不过这题不用积分,求导就可以了。
后话
第二章就到这里啦,还挺久的。
溜了,去打数竞的题目,有机会的话,可以做一个数竞高数的专题系列blog。
【超详细】随机变量及其分布——《概率论与数理统计》第二章学习笔记相关推荐
- 2021-08-08概率论与数理统计-第二章
文章目录 概率论与数理统计-第二章 概率论与数理统计-第二章
- 概率论与数理统计——高斯分布的学习笔记
1 高斯分布的数学定义 高斯分布的定义来自<概率论与数理统计·浙江大学>:
- 多维随机变量及其分布——《概率论及其数理统计》第三章学习笔记
多维随机变量及其分布--<概率论及其数理统计>第三章学习笔记 文章目录 多维随机变量及其分布--<概率论及其数理统计>第三章学习笔记 前言 MindMap 二维随机变量 定义与 ...
- 概率论与数理统计(第二版) 吴传生 编 高等教育出版社 大学课后习题答案
概率论与数理统计(第二版) 吴传生 编 高等教育出版社 第1章:随机事件的概率 第2章:一维随机变量及其分布 第3章:多维随机变量及其分布 第4章:随机变量的数字特征 第5章:大数定律和中心极限定律 ...
- [概统]本科二年级 概率论与数理统计 第二讲 几何概型
[概统]本科二年级 概率论与数理统计 第二讲 几何概型 蒲丰投针问题 Buffon's Needle Problem 伯川德悖论 Bertrand Paradox 几何概型的思想非常简单,用图形表示事 ...
- 王式安概率论与数理统计基础课手写笔记-第一章概率与事件-第二章随机变量及其分布
写在前面:做题还是要做的,但是课本上基础理论不能忘,比如每章前言,告知本章研究的内容及研究的方法.走过的路都算数. 文章目录 第一章 概率与事件 第二章 随机变量及其分布 第一章 概率与事件 第二章 ...
- 郝志峰《概率论与数理统计》期末复习笔记
目录 前言 第一章 概率论的基础概念 知识大纲 随机试验 随机事件 事件概率 等可能概率模型 第二章 概率论的基本定理 知识大纲 条件概率 独立性 全概率公式 贝叶斯公式 ...
- 《概率论与数理统计》再学习之事件的互斥(互不相容)和独立的关系
前言 事件的互不相容性和独立性,在学习的时候突然觉得这两者之间总是存在是若即若离的关系,一时间不知道怎么去归纳总结好.一直找了很多信息来看,那么究竟应该怎么去区别或者什么时候使用比较好呢? 问题 互不 ...
- 超详细的计算机网络基础知识总结 第三章:数据链路层
本文基于:王道计算机考研-计算机网络 其他文章: 超详细的计算机网络基础知识 第一章:概述 超详细的计算机网络基础知识 第二章:物理层 超详细的计算机网络基础知识 第四章:数据链路层 超详细的计算机网 ...
- 超详细的计算机网络基础知识总结 第四章:网络层
本文基于:王道计算机考研-计算机网络 ☺其他文章: 超详细的计算机网络基础知识 第一章:概述 超详细的计算机网络基础知识 第二章:物理层 超详细的计算机网络基础知识 第三章:数据链路层 超详细的计算机 ...
最新文章
- Windows的位图alpha混合技术
- python类装饰器详解-Python类装饰器实现方法详解
- springboot系列——redisTemplate和stringRedisTemplate对比、redisTemplate几种序列化方式比较
- VS开发中的代码编写小技巧——避免重复代码编写的几种方法
- mysql useunicode_jdbc连接mysql 为什么在连接时已经这样设置了 ?useUnicode=truecharacterEncodin...
- 苹果手机升级13无法开机_苹果手机更新系统后无法开机
- 贪吃蛇游戏-小程序游戏
- android 修改图片的宽高
- python练习题之乌龟吃鱼游戏
- 【精华】安卓开发学习路线规划
- java第六章十七题_Java语言面试题十七
- K8S Pod配置进阶1 containers字段解释
- 我的世界服务器水流动配置文件,我的世界后台的水流动命令是什么
- 《求职》第四部分 - 操作系统篇 - 操作系统常见问题
- NISP一级模拟题(一、二)
- C语言经典练习题(2)——“冒泡排序(Bubble Sort)“
- 服务器上Kafka启动报错:error=‘Cannot allocate memory‘ (errno=12)
- 小型气象站参数有哪些
- 04-如何选购台式电脑显卡?小白装机通俗易懂的独立显卡知识指南
- Java高级深入与JVM
热门文章
- idea weblogic 部署慢_IDEA+weblogic部署运行项目
- Real-Time Rendering——16.1 Sources of Three-Dimensional Data三维数据的来源
- 常见AutoCAD病毒(acad.fas、acad.lsp)清除方法
- Unix网络编程5种IO模型
- 手机中CAD图纸发送到电脑上后打不开了怎么办?
- mysql校验规则居民身份证号_身份证号规则及校验
- python爬取某鱼的直播间信息
- DDR3:MIG控制器设计(vivado)
- htc one m7刷Linux,htc one m7刷coloros系统教程
- java把字符串转为日期_Java程序将字符串转换为日期