定义1:\textbf{定义1:}对于一个随机变量,如果它的空间要么有限,要么可数,那么我们称其是一个离散随机变量。

对于集合D\mathcal{D},如果它的元素是可列的,那么我们称这个集合是可数的;例如在D\mathcal{D}与正整数之间存在一个一一对应的关系。

例1:\textbf{例1:}考虑抛硬币产生的独立序列,每个结果要么是头(H)(H)要么是尾(T)(T)。进一步,在每次抛的过程中,我们假设H,TH,T是等可能的,即P(H)=P(T)=12P(H)=P(T)=\frac{1}{2}。样本空间C\mathcal{C}由像TTHTHHT⋯TTHTHHT\cdots这样的序列组成,令随机变量XX第一次抛出头时所抛的次数,那么对于给定的序列,X=3X=3。显然XX的空间是D={1,2,3,4,…}\mathcal{D}=\{1,2,3,4,\ldots\},当开始是HH 时X=1X=1,因此P(X=1)=12P(X=1)=\frac{1}{2},同样得当序列为THTH 时X=2X=2,根据独立性可知概率P(X=2)=(12)(12)=14P(X=2)=(\frac{1}{2})(\frac{1}{2})=\frac{1}{4}。更一般得,如果X=xX=x,其中x=1,2,3,4,…x=1,2,3,4,\ldots,那么前面有x−1x-1次为尾,即TT⋯THTT\cdots TH,所以根据独立性,我们有

P(X=x)=(12)x−1(12)=(12)x,x=1,2,3,…

P(X=x)=\left(\frac{1}{2}\right)^{x-1}\left(\frac{1}{2}\right)=\left(\frac{1}{2}\right)^x,\quad x=1,2,3,\ldots

这个空间是可数的。一个有趣的事件是第一处出现头的次数为奇数;例如X=∈{1,3,5,…}X=\in\{1,3,5,\ldots\},这个事件的概率为

P[X∈{1,3,5,…}]=∑x=1∞(12)2x−1=1/21−(1/4)=23

P[X\in\{1,3,5,\ldots\}]=\sum_{x=1}^\infty\left(\frac{1}{2}\right)^{2x-1}=\frac{1/2}{1-(1/4)}=\frac{2}{3}

通过上面的例子表明,关于离散随机变量的概率可以用P(X=x)P(X=x)的概率求出来,这些概率确定了一个重要的函数,定义下:

定义2:\textbf{定义2:}令XX是离散随机变量,空间为D\mathcal{D},XX的概率质量函数由

pX(x)=P[X=x],for x∈D

p_X(x)=P[X=x],for\ x\in\mathcal{D}

给出。

注意,pmf满足下面两条性质:

(i)0≤pX(x)≤1,x∈D;(ii)Σx∈DpX(x=1)

(i)0\leq p_X(x)\leq 1,x\in\mathcal{D};(ii)\Sigma_{x\in\mathcal{D}}p_X(x=1)

对于离散集合D\mathcal{D},如果一个函数满足性质(i)(ii)(i)(ii),那么这个函数唯一确定了随机变量的分布。

令XX是离散随机变量,空间为D\mathcal{D},FX(x)F_X(x)的不连续点定义了质量;即如果xx是FXF_X的一个不连续点,那么P(X=x)>0P(X=x)>0。现在我们将随机变量空间与概率为正的点区别开来,对那些空间XX中概率为正的点我们定义其为随机变量XX 的支撑,我们经常用S\mathcal{S}来表示XX的支撑,注意S⊂D\mathcal{S}\subset\mathcal{D},当然也有可能S=D\mathcal{S}=\mathcal{D}

例2:\textbf{例2:}现在有100个保险丝,从中随机抽出5个进行检测;如果5个均合格,那么这100个接受。事实上,这100个中有20个不合格,那么该保险丝被接受的概率为

(805)(1005)=0.32

\frac{\binom{80}{5}}{\binom{100}{5}}=0.32

更一般得,令随机变量XX是5个中不合格的个数,那么XX的pmf为

pX(x)=⎧⎩⎨⎪⎪(20x)(805−x)(1005)0for x=0,1,2,3,4,5elsewhere

p_X(x)= \begin{cases} \frac{\binom{20}{x}\binom{80}{5-x}}{\binom{100}{5}}&for\ x=0,1,2,3,4,5\\ 0&elsewhere \end{cases}

很明显,XX的空间是D={0,1,2,3,4,5}\mathcal{D}=\{0,1,2,3,4,5\},这是满足超几何分布的随机变量的实例,基于这些讨论很容易画出XXcdf的图像。

在统计学中经常会遇到这样的问题,我们有一个随机变量XX 并且知道它的分布,然而我们感兴趣的是随机变量YY,他它是XX的某个变量,Y=g(X)Y=g(X)。尤其是我们想确定YY的分布,假设XX在空间DX\mathcal{D}_X中是离散的,那么YY的空间是DY={g(x):x∈DX}\mathcal{D}_Y=\{g(x):x\in\mathcal{D}_X\}。现在考虑两种情况:

首先gg是一对一的,那么YY的pmf为

pY(y)=P[Y=y]=P[g(X)=y]=P[X=g−1(y)]=pX(g−1(y))(1)

\begin{equation} p_Y(y)=P[Y=y]=P[g(X)=y]=P[X=g^{-1}(y)]=p_X(g^{-1}(y))\tag1 \end{equation}

例3:\textbf{例3:}考虑例1的几何随机变量XX,XX是第一次出现头时所抛硬币的次数,令YY是第一次出现头时前面所抛硬币的次数,即Y=X−1Y=X-1。这时函数gg为g(x)=x−1g(x)=x-1,其逆为g−1(y)=y+1g^{-1}(y)=y+1,YY的空间是DY={0,1,2,…}D_Y=\{0,1,2,\ldots\},根据等式1的表达式可得YY的pmf是

pY(y)=pX(y+1)=(12)y+1,for y=0,1,2,…

p_Y(y)=p_X(y+1)=\left(\frac{1}{2}\right)^{y+1},for\ y=0,1,2,\ldots

例4:\textbf{例4:}令XX的pmf为

pX(x)={3!x!(3−x)!(23)x(13)3−x0x=0,1,2,3elsewhere

p_X(x)= \begin{cases} \frac{3!}{x!(3-x)!}(\frac{2}{3})^x(\frac{1}{3})^{3-x}&x=0,1,2,3\\ 0&elsewhere \end{cases}

我们现在求随机变量Y=X2Y=X^2的pmfpY(y)p_Y(y),变换y=g(x)=x2y=g(x)=x^2将DX={x:x=0,1,2,3}\mathcal{D}_X=\{x:x=0,1,2,3\}映射到DY={y:y=0,1,4,9}\mathcal{D}_Y=\{y:y=0,1,4,9\},一般而言,y=x2y=x^2不是一对一映射的;但是这里是满足条件的,因为DX={x:x=0,1,2,3}\mathcal{D}_X=\{x:x=0,1,2,3\}中的xx不存在负值,即我们有单值的反函数x=g−1(y)=y√x=g^{-1}(y)=\sqrt y(不是−y√-\sqrt y),并且

pY(y)=pX(y√)=3!(y√)!(3−y√)!(23)y√(13)3−y√, y=0,1,4,9

p_Y(y)=p_X(\sqrt y)=\frac{3!}{(\sqrt y)!(3-\sqrt y)!}\left(\frac{2}{3}\right)^{\sqrt y}\left(\frac{1}{3}\right)^{3-\sqrt y},\ y=0,1,4,9

第二种情况中的变换g(x)g(x)不是一对一的。虽然不是绝对的,但是对大多数涉及离散随机变量的应用来说,YY的pmf通过直接的方法就能得到,为此我们给出两个例子。

考虑例3中的几何随机变量,我们玩一个游戏,如果第一次头出现的次数为偶数甲方赢一元,如果是奇数那么甲方输一元,令YY表示我们的净收益,那么YY的空间是{−1,1}\{-1,1\}。例1 中已经计算出XX为奇的概率为23\frac{2}{3},因此YY的分布为pY(−1)=2/3,pY(1)=1/3p_Y(-1)=2/3,p_Y(1)=1/3。

考虑另一个例子,令Z=(X−2)2Z=(X-2)^2,其中XX是例1的几何随机变量,那么ZZ的空间是DZ={0,1,4,9,16,…}\mathcal{D}_Z=\{0,1,4,9,16,\ldots\},注意当且仅当X=2X=2时Z=0Z=0;当且仅当X=1X=1或者X=3X=3时Z=1Z=1;而其他情况存在一对一的关系:x=z√+2,z∈{4,9,16,…}x=\sqrt z+2,z\in\{4,9,16,\ldots\}。因此ZZ的pmf是:

pZ(x)=⎧⎩⎨⎪⎪⎪⎪pX(2)=14pX(1)+pX(3)=58pX(z√+2)=14(12)z√for z=0for z=1for z=4,9,16,…

p_Z(x)= \begin{cases} p_X(2)=\frac{1}{4}&for\ z=0\\ p_X(1)+p_X(3)=\frac{5}{8}&for\ z=1\\ p_X(\sqrt z+2)=\frac{1}{4}(\frac{1}{2})^{\sqrt z}&for\ z=4,9,16,\ldots \end{cases}

为了验证其正确性,读者可以试着计算Z<script type="math/tex" id="MathJax-Element-2666">Z</script>的pmf在其空间上求和等于1。

博文pdf版本下载地址:http://pan.baidu.com/s/1i5OaIUT

漫步数理统计九——离散随机变量相关推荐

  1. 漫步数理统计十二——随机变量的期望

    本篇讲解期望运算,之后内容都会涉及到这种运算. 定义1:\textbf{定义1:}(期望)令XX表示一个随机变量,如果XX 是连续的随机变量,pdf为f(x)f(x)且 ∫∞−∞|x|f(x)dx&l ...

  2. 漫步数理统计十——连续随机变量(上)

    上篇文章我们讨论了离散随机变量,在统计应用中还有一个非常重要的随机变量,那就是这里要讲的连续随机变量. 定义1:\textbf{定义1:}对于某个随机变量,如果它的累加分布函数FX(x)F_X(x)对 ...

  3. 漫步数理统计十一——连续随机变量(下)

    定理1:\textbf{定理1:}令XX是连续随机变量,其pdf为fX(x)f_X(x),支撑为SX\mathcal{S}_X,令Y=g(X)Y=g(X),其中g(x)g(x)是XX支撑S\mathc ...

  4. 漫步数理统计八——随机变量(下)

    接下来考虑离散随机变量的累加分布函数. 例2:\textbf{例2:}考虑例11,XX的空间是D={2,-,12}\textbf{D}=\{2,\ldots,12\},如果x<2x,那么FX(x ...

  5. 漫步数理统计七——随机变量(上)

    读者可能会有这样的感受,如果样本空间C\textbf{C}中的元素不是数的话,描述起来非常麻烦,现在我们就形式化一个规则或者一组规则,根据这些规则,C\textbf{C}中的元素cc可以用数来表示.首 ...

  6. 二维随机变量期望公式_MIT 6.041 概率论笔记 离散随机变量(二)

    6.Discrete Random Variables II 离散随机变量(二) Standard deviation 标准差 若想要以相同单位衡量数据的偏移量,可以将方差开根,得到随机变量X分布的标 ...

  7. 模板:min-max容斥离散随机变量的几何分布(洛谷P3175:[HAOI2015]按位或)

    前言 见到一道神题,学会两个知识点- 都是数学. min-max容斥 给出式子: max⁡(S)=∑T⊂S(−1)∣T∣min⁡(T)\max(S)=\sum_{T\sub S}(-1)^{|T|}\ ...

  8. 漫步数理统计三十三——采样与统计量

    本篇博文介绍一些有用的推断工具:置信区间与假设检验. 在典型的统计问题中,我们对随机变量XX感兴趣,但是对其pdff(x)f(x)与pmfp(x)p(x)不知道,对此大致有两个类别: f(x)f(x) ...

  9. 漫步数理统计三十二——中心极限定理

    如果X1,X2,-,XnX_1,X_2,\ldots,X_n是均值为μ\mu,方差为σ2\sigma^2正态分布的随机样本,那么对任意正整数nn,随机变量 ∑n1Xi−nμσn‾‾√=n‾‾√(X¯n ...

最新文章

  1. Layman’s explanation of SAP IS Retail concepts: assortments and listing
  2. JavaScript语句模版
  3. ATSAMD21-XPRO开发板 评估基于 ATSAM D21 CortexM0+ 的微控制器
  4. C语言中,宏和全局变量的区别是什么?
  5. 今日头条Marketing API小工具(.Net Core版本)
  6. [SpringSecurity]web权限方案_用户认证_查询数据库完成认证
  7. struts+hibernate+oracle+easyui实现lazyout组件的简单案例——工具类
  8. rsoft透射谱_基于Rsoft软件光纤光栅的仿真模拟
  9. 终端传感了解吗?18个知识点为你扫盲
  10. ORACLE基本配置
  11. php ds扩展,PHP教程:老生常谈PHP中的数据结构:DS扩展
  12. 2018-2019 ACM-ICPC, Asia Jiaozuo Regional Contest题解
  13. service获取selinux权限_Spring Boot 整合 Spring Security 示例实现前后分离权限注解 + JWT 登录认证...
  14. steam当前计算机无法,steam无法打开【操作思路】
  15. java io流练习题_Java IO流经典练习题
  16. java映射和反射的理解
  17. latex ctex 中文目录在pdf阅读器的“书签”选项卡中显示乱码的解决方法
  18. 2021-2027全球与中国网眼织物纺织品市场现状及未来发展趋势
  19. 全国计算机等级四级计算机网络第6套答案,全国计算机等级考试四级计算机网络第6套试题(2)...
  20. 华为ESNP,路由器和交换机连接电脑不同网段的解决方法。

热门文章

  1. 安装和卸载mysql
  2. 工具对比_模拟慢网速环境
  3. 查询长期未登录AD的用户
  4. 如何防止网页Demo被那些赖账的客户盗用
  5. 文昌帝君 -- 《文昌帝君阴骘文》
  6. JavaScript 设计模式核⼼原理与应⽤实践之单例模式——Vuex的数据管理哲学
  7. 如何在Mac上安装Node.js和NPM
  8. 2019国内某知名科技公司技术资料
  9. webpack Plugin常用 optimization splitChunks UglifyJsPlugin sourceMap
  10. Tensorflow MNIST 手写识别