2.1 一维随机变量

2.1.1 随机变量的概念

所谓随机变量,就是其值随机会而定的变量.例如骰子的点数X,在试验前无法确定它将取何值,但一旦试验结束,点数就确定了.而与之相对的就是确定变量,其取值遵循某种严格的规律,在试验前就能准确预知出来.例如骰子自由落体的距离H,我不需要进行试验就可根据自由落体定律计算出每个时刻对应的落体高度。

第一章提到的随机事件,实际上是包含随机变量这个更广泛的范围之内。例如事件:骰子的点数大于等于3可以用{X≥3}\{X\ge 3\}{X≥3}表示。更进一步的,我们可以使用指示变量Y。

随机变量又可以分为离散型随机变量连续型随机变量

2.1.2 离散型随机变量的分布及其重要例子

设XXX为离散型随机变量, 其全部可能值为{a1\left\{a_{1}\right.{a1​,a2⋯}\left.a_{2} \cdots\right\}a2​⋯}. 则
pi=P(X=ai),i=1,2,⋯p_{i}=P\left(X=a_{i}\right), i=1,2, \cdots pi​=P(X=ai​),i=1,2,⋯
称为XXX的概率函数.

显然有
pi⩾0,p1+p2+⋯=1p_{i} \geqslant 0, p_{1}+p_{2}+\cdots=1 pi​⩾0,p1​+p2​+⋯=1
概率函数也称为XXX的概率分布,其还有如下两种表现形式.

设XXX为一随机变量,则函数
P(X⩽x)=F(x),−∞<x<∞P(X \leqslant x)=F(x),-\infty<x<\infty P(X⩽x)=F(x),−∞<x<∞
称为XXX的分布函数

对任何随机变量XXX, 其分布函数F(x)F(x)F(x)具有下面的一般性质:

1.F(X)F(X)F(X)是单调非降的: 当(x1<x2)\left(x_{1}<x_{2}\right)(x1​<x2​)时, 有F(x1)⩽F(x2)F\left(x_{1}\right) \leqslant F\left(x_{2}\right)F(x1​)⩽F(x2​).
2. 当x→∞x \rightarrow \inftyx→∞时,F(x)→1F(x) \rightarrow 1F(x)→1; 当x→−∞x \rightarrow-\inftyx→−∞时,F(x)→0F(x) \rightarrow 0F(x)→0,

下面介绍常见的离散型随机变量的分布

二项分布

若随机变量XXX的概率函数为
pk=P(X=k)=Cnkpkqn−k,k=0,1,⋯,np_{k}=P(X=k)=C_{n}^{k} p^{k} q^{n-k}, k=0,1, \cdots, n pk​=P(X=k)=Cnk​pkqn−k,k=0,1,⋯,n
其中0<p<1,q=1−p0<p<1, q=1-p0<p<1,q=1−p, 则称XXX服从参数为n,pn, pn,p的二项分布, 记为X∼B(n,p)X \sim B(n, p)X∼B(n,p)

这个分布的现实意义为从有放回的抽查nnn个元件,元件次品率为ppp,检查出次品的个数为XXX。

下面讨论当kkk取何值时概率有最大值。

  1. 当(n+1)p(n+1) p(n+1)p为整数时,pkp_{k}pk​在k=(n+1)p−1k=(n+1) p-1k=(n+1)p−1和k=(n+1)pk=(n+1) pk=(n+1)p达到最大,
  2. 当(n+1)p(n+1) p(n+1)p不是整数时,pkp_{k}pk​在k=[(n+1)p]k=[(n+1) p]k=[(n+1)p]达到最大。其中,[x][x][x]表示不超过xxx的最大整数。

泊松分布

如果随机变量XXX的概率函数为
pk=P(X=k)=λkk!e−λ,k=0,1,2,⋯p_{k}=P(X=k)=\frac{\lambda^{k}}{k !} e^{-\lambda}, \quad k=0,1,2, \cdots pk​=P(X=k)=k!λk​e−λ,k=0,1,2,⋯
其中λ>0\lambda>0λ>0为常数, 则称XXX服从参数为λ\lambdaλ的泊松分布, 记为X∼P(λ)X \sim P(\lambda)X∼P(λ)。

这个分布的现实意义为描述大量试验中稀有事件出现频数概率模型。

泊松分布可以作为二项分布的极限而得到。一般地说,若X∼B(n,p)X \sim B(n, p)X∼B(n,p), 其中nnn很大,ppp很小而np=λn p=\lambdanp=λ不太大 时,则XXX的分布接近于泊松分布P(λ).P(\lambda) .P(λ).

为了帮助直观理解这个结论,陈希孺给出了一个例子:在一定时间内某交通路口所发生的事故个数。

为方便计,设所观察的这段时间为[0,1)[0,1)[0,1). 取一个很大的自然数nnn, 把时间段[0,1)[0,1)[0,1)分为等长的nnn段:
l1[0,1n),l2=[1n,2n),⋯,li=[i−1n,in),⋯ln=[n−1n,1)\begin{aligned} l_{1}\left[0, \frac{1}{n}\right), l_{2} &=\left[\frac{1}{n}, \frac{2}{n}\right), \cdots, l_{i}=\left[\frac{i-1}{n}, \frac{i}{n}\right), \cdots \\ l_{n} &=\left[\frac{n-1}{n}, 1\right) \end{aligned} l1​[0,n1​),l2​ln​​=[n1​,n2​),⋯,li​=[ni−1​,ni​),⋯=[nn−1​,1)​
作几个假定:

  1. 在每段lil_{i}li​内,恰发生一个事故的概率,近似地与这段时 间之长1n\frac{1}{n}n1​成正比,即可取为λ/n.\lambda / n .λ/n.又假定在nnn很大因而1/n1 / n1/n很小 时,在lil_{i}li​这么短暂的一段时间内,要发生两次或更多的事故是不 可能的. 因此,在lil_{i}li​时段内不发生事故的概率为1−1/n1-1 / n1−1/n.而这体现了事件的稀有性。

  2. l1,⋯,lnl_{1}, \cdots, l_{n}l1​,⋯,ln​各段是否发生事故是独立的.

    根据以上假定,XXX应服从二项分 布B(n,λ/n)B(n, \lambda / n)B(n,λ/n). 于是
    P(X=i)=(ni)(λn)i(1−λn)n−iP(X=i)=\left(\begin{array}{l} n \\ i \end{array}\right)\left(\frac{\lambda}{n}\right)^{i}\left(1-\frac{\lambda}{n}\right)^{n-i} P(X=i)=(ni​)(nλ​)i(1−nλ​)n−i

将nnn取极限即可推出泊松分布。

超几何分布

如果随机变量XXX的概率函数为

P(X=m)=(Mm)(N−Mn−m)/(Nn)P(X=m)=\left(\begin{array}{l}M \\ m\end{array}\right)\left(\begin{array}{c}N-M \\ n-m\end{array}\right) /\left(\begin{array}{l}N \\ n\end{array}\right)P(X=m)=(Mm​)(N−Mn−m​)/(Nn​)

则称XXX服从超几何分布。

该分布的现实意义为无放回的抽样。若n/Nn / Nn/N很小,则 放回与不放回差别不大. 由此可见,在这种情况下超几何分布应与 二项分布很接近. 确切地说,若XXX服从超几何分布 则当nnn固定,M/N=pM / N=pM/N=p固定,N→∞N \rightarrow \inftyN→∞时,XXX近似地服从二项分布B(n,p)B(n, p)B(n,p)

负二项分布

如果随机变量XXX的概率函数为

P(X=i)=b(r−1;i+r−1,p)p=(i+r−1r−1)pr(1−p)iP(X=i)=b(r-1 ; i+r-1, p) p=\left(\begin{array}{c}i+r-1 \\ r-1\end{array}\right) p^{r}(1-p)^{i}P(X=i)=b(r−1;i+r−1,p)p=(i+r−1r−1​)pr(1−p)i

则称XXX服从负二项分布。

该分布的现实意义为同样为抽样检查,不过不同的是预先定一个数rrr, 一个一个地元件中抽样检查,直到发现第rrr个次品为 止.以XXX记到当时为止已检出的合格品个数.

当r=1r=1r=1时,P(X=i)=p(1−p)iP(X=i)=p(1-p)^{i}P(X=i)=p(1−p)i。这称为几何分布。

2.1.3 连续型随机变量的分布及重要例子

连续型随机变量的概率分布与离散型大不相同。例如,如在靶面上指定一个几何意义下的点(即只有位置而无任何向度),则 “射击时正好命中该点”的概率,也只能取为 0 .那么参照离散型用P(X=i)P(X=i)P(X=i)刻画就毫无意义。

为了刻画连续型随机变量的概率分布,我们引入了概率密度函数

设连续性随机变量XXX有概率分布函数F(x)F(x)F(x), 则F(x)F(x)F(x)的导数f(x)=F′(x)f(x)=F^{\prime}(x)f(x)=F′(x), 称为XXX的概率密度函数.

连续型随机变量XXX的密度函数f(x)f(x)f(x)都具有以下三条基本性质:

1.f(x)⩾0f(x) \geqslant 0f(x)⩾0
2.∫−∞∞f(x)dx=1\int_{-\infty}^{\infty} f(x) \mathrm{d} x=1∫−∞∞​f(x)dx=1

  1. 对任何常数a<ba<ba<b有

P(a⩽X⩽b)=F(b)−F(a)=∫ab(x)dxP(a \leqslant X \leqslant b)=F(b)-F(a)=\int_{a}^{b}(x) \mathrm{d} x P(a⩽X⩽b)=F(b)−F(a)=∫ab​(x)dx

有了概率密度函数这个工具后,下面介绍常见的连续性随机变量分布。

正态分布

若随机变量XXX的密度函数为
p(x)=12πσe−(x−μ)22σ2,−∞<x<∞p(x)=\frac{1}{\sqrt{2 \pi} \sigma} e^{-\frac{(x-\mu)^{2}}{2 \sigma^{2}}}, \quad-\infty<x<\infty p(x)=2π​σ1​e−2σ2(x−μ)2​,−∞<x<∞
其中μ,σ(>0)\mu, \sigma(>0)μ,σ(>0)为常数, 则称XXX服从参数为μ,σ2\mu, \sigma^{2}μ,σ2的正态分布, 记为X∼N(μ,σ2)X \sim N\left(\mu, \sigma^{2}\right)X∼N(μ,σ2)

正态分布的现实意义为一般事物常为中间多两头少的分布,例如一群人的身高或体重。

当μ=1,σ2=1\mu=1, \sigma^{2}=1μ=1,σ2=1时, 便成为
f(x)=e−x2/2/2πf(x)=\mathrm{e}^{-x^{2} / 2} / \sqrt{2 \pi} f(x)=e−x2/2/2π​
它是正态分布N(0,1)N(0,1)N(0,1)的密度函数. 其密度函数和分布函数常分别记为φ(x)\varphi(x)φ(x)和Φ(x)\Phi(x)Φ(x),

若X∼N(μ,σ2)X \sim N\left(\mu, \sigma^{2}\right)X∼N(μ,σ2), 则Y=(X−μ)/σ∼N(0,1)Y=(X-\mu) / \sigma \sim N(0,1)Y=(X−μ)/σ∼N(0,1)

指数分布

若随机变量XXX的概率密度函数为
p(x)={λe−λxx⩾00x<0p(x)=\left\{\begin{array}{ll} \lambda e^{-\lambda x} & x \geqslant 0 \\ 0 & x<0 \end{array}\right. p(x)={λe−λx0​x⩾0x<0​
其中λ>0\lambda>0λ>0为常数, 则称XXX服从参数为λ\lambdaλ的指数分布, 记为X∼E(λ)X \sim E(\lambda)X∼E(λ)。XXX的分布函数为
F(x)={1−e−λxx⩾00其他 F(x)=\left\{\begin{array}{cc} 1-e^{-\lambda x} & x \geqslant 0 \\ 0 & \text { 其他 } \end{array}\right. F(x)={1−e−λx0​x⩾0 其他 ​
该分布的现实意义为一批无老化元件的寿命。“无老化”.就是说:“元件在时刻xxx尚 能正常工作的条件下,其失效率总保持为某个常数λ>0\lambda>0λ>0, 与xxx无关”.

威布尔分布

元件无老化在现实中是不可能的。失效率ppp应取为一个xxx的增函数,例如λxm\lambda x^{m}λxm

此时便得到威布尔分布。

其分布函数为
F(x)=1−e−(λ/m+1)xn+1F(x)=1-\mathrm{e}^{-(\lambda / m+1) x^{n+1}} F(x)=1−e−(λ/m+1)xn+1

取α=m+1(α>1)\alpha=m+1(\alpha>1)α=m+1(α>1), 并把λ/(m+1)\lambda /(m+1)λ/(m+1)记为λ\lambdaλ, 得出
F(x)=1−e−λxn,x>0F(x)=1-\mathrm{e}^{-\lambda x^{n}}, x>0 F(x)=1−e−λxn,x>0

而F(x)=0F(x)=0F(x)=0当x⩽0x \leqslant 0x⩽0. 此分布之密度函数为

f(x)={λaxa−1e−λxa,x>00,x⩽0f(x)=\left\{\begin{array}{lr} \lambda a x^{a-1} \mathrm{e}^{-\lambda x^{a}}, & x>0 \\ 0, & x \leqslant 0 \end{array}\right. f(x)={λaxa−1e−λxa,0,​x>0x⩽0​

概率论与数理统计(陈希孺)笔记2.1相关推荐

  1. 宋浩概率论与数理统计-第八章-笔记

    概率论与数理统计 第八章 假设检验 8.1 基本概念 一.假设检验问题 二.假设检验基本概念 三.假设检验的思想与步骤 1. 思想 2. 步骤 四.两类错误 8.2 一个正态总体的参数假设检验 一.μ ...

  2. 概率论与数理统计(学习笔记)——平平无奇的知识点

    概率论与数理统计 第一章:随机事件及其计算 自然现象:确定性现象 随机现象:事先不能准确预知其结果的现象. 1.1.单位名称 样本点(ω):实验中可能出现的基本结果 样本空间(Ω): 全部样本点构成的 ...

  3. 《概率论与数理统计》—读书笔记

    概率论的基本概念 概率论与数理统计是研究和揭示随机现象统计规律性的一门数学学科. 统计规律性:在大量重复试验或观察中所呈现出的固有规律性. 随机现象:在个别试验中其结果呈现出不确定性,在大量重复试验中 ...

  4. 《概率论与数理统计》复习笔记

    最近整理了一下期末复习笔记,我们用的教材是人民邮电出版社慕课版的,希望可以帮助到一些需要的小伙伴!(开摆了,已经不想整理了/(ㄒoㄒ)/~~) 目录 第一章 随机事件与概率 第二章 随机变量及其分布 ...

  5. 2021年秋季《概率论与数理统计》学习笔记

    多维随机变量及之后内容.概念理解和误区澄清性质笔记可参考本专栏其他博客. 20211002更新至2.4连续型随机变量 "概率的概率" 20210930更新 几何分布无记忆性证明 泊 ...

  6. 【2020/07/16修订】概率论与数理统计(电子科技大学) 知识梳理 · 第一版(1到8章 · 度盘)

    概率论与数理统计 知 识 梳 理 (第一版) 建议先修课程:高等数学(微积分) 配套课程: 1.慕课(MOOC):概率论与数理统计(电子科技大学) 2.教材:概率论与数理统计 电子科技大学应用数学学院 ...

  7. 古典概型——概率论与数理统计(宋浩)

    事件的概率 1.2.1概率的初等描述 概率的定义:事件发生的可能性的大小(P(A)) 性质: P(Ω)=1,P(φ)=0(规范性) 0<=P(A)<=1(非负性) 有限可加:A1,A2,A ...

  8. 样本空间与事件集合,事件间的关系——概率论与数理统计(宋浩)

    1.1.1随机试验与随机事件 统计规律 1.随机试验(用E表示): (1)在相同条件下可重复 (2)结果不止一个 (3)无法预测 2.事件:每种试验结果 3.随机事件(用大写A,B,C--表示):可能 ...

  9. 几何概型,公理化——概率论与数理统计(宋浩)

    1.2.3几何概率模型(线段,平面,立体) 例题:会面问题 甲,乙在一小时内的任意时刻都可以到达,先到达的人会等后到的人15分钟,超时离开,求两个人可以碰面的概率. 可列出方程并做出对应的图: 用x轴 ...

  10. 多维随机变量及其分布——《概率论及其数理统计》第三章学习笔记

    多维随机变量及其分布--<概率论及其数理统计>第三章学习笔记 文章目录 多维随机变量及其分布--<概率论及其数理统计>第三章学习笔记 前言 MindMap 二维随机变量 定义与 ...

最新文章

  1. (python的坑,坑的我头晕,下行循环写后根遍历)
  2. LINUX 如何实现多线程进行cp复制
  3. MySQL 高级 - 触发器 - 介绍
  4. java群发图文消息_使用Java语言开发微信公众平台(四)——图文消息的发送与响应...
  5. iOS-应用生命周期
  6. centos安装盘ntfs_在CentOS下挂载NTFS格式U盘的方法
  7. Unity(一)必然事件
  8. Asp.NetWebForm的控件属性
  9. HGE2D引擎按键消息分析
  10. 计算机几何学论坛,现代几何学与计算机科学-中国计算机学会.pdf
  11. 基于RTP协议的数据通讯程序
  12. Mysql解决存入表情报错的问题,调整编码为utf8mb4
  13. 将文件保存到数据库中
  14. DODAF2.0之能力视角如何落地
  15. 台达 PLC ISPSoft 3.16--项目文件解密
  16. iSCSI客户端登陆认证失败
  17. ajax传参无法传中文,IE浏览器 ajax传参数值为中文时出现乱码的解决方案
  18. ipa在线安装搭建_在线安装IPA 文件和视频下载
  19. dedecms怎么改php版本_王者荣耀:管你版本怎么改,这几位峡谷常青树始终屹立不倒...
  20. 论文笔记 EMNLP 2020|Graph Transformer Networks with Syntactic and Semantic Structures for Event Argument

热门文章

  1. 邹博机器学习代码分析(1)-线性回归
  2. Redis开发与运维之第八章理解内存(五)
  3. 《Redis开发与运维》读书笔记三
  4. 11.3.3 BINARY 和 VARBINARY 类型
  5. windows虚拟显示器开发(一)
  6. 36款免费可商用字体 附字体分享链接
  7. 各省份的车牌简称 备案地区的简称
  8. 计算机系统大作业-程序人生
  9. 【调度问题】基于遗传算法求解公交排班系统matlab源码
  10. 用系统工具sxstrace检查缺少的VC运行时组件