在开始本节课之前,本着概率论的逻辑,我们首先来定义概率空间(Ω,F,P)(\Omega,\mathscr{F},P)(Ω,F,P),其中A∈FA\in \mathscr{F}A∈F为样本空间中的事件。


随机变量关于随机变量的条件期望

下面给出条件概率和条件期望的定义:
定义:条件概率,条件分布函数,条件期望

  1. 设X,YX,YX,Y是离散型随机变量,对给定的yyy,若P{Y=y}>0P\{Y=y\}>0P{Y=y}>0,则称
    P{X=x∣Y=y}=P{X=x,Y=y}P{Y=y}P\{X=x|Y=y\}=\frac{P\{X=x,Y=y\}}{P\{Y=y\}}P{X=x∣Y=y}=P{Y=y}P{X=x,Y=y}​
    为给定Y=yY=yY=y时XXX的条件概率。

    此时Y=yY=yY=y,XXX的分布函数为:
    F(x∣y)=P{X≤x∣Y=y},x∈RF(x|y)=P\{X\le x|Y=y\},x\in RF(x∣y)=P{X≤x∣Y=y},x∈R
    X的条件期望为:
    E[X∣Y=y]=∫xdF(x∣y)=∑xxP{X=x∣Y=y}E[X|Y=y]=\int xdF(x|y)=\sum_x xP\{X=x|Y=y\}E[X∣Y=y]=∫xdF(x∣y)=x∑​xP{X=x∣Y=y}

  2. 若X,YX,YX,Y是连续型随机变量,
    其联合概率密度为f(x,y)f(x,y)f(x,y),
    则对一切使fY(y)>0f_Y(y)>0fY​(y)>0的yyy,给定Y=yY=yY=y时,
    XXX的条件概率密度定义为:
    f(x∣y)=f(x,y)fY(y)f(x|y)=\frac{f(x,y)}{f_Y(y)}f(x∣y)=fY​(y)f(x,y)​
    给定Y=yY=yY=y时,XXX的条件分布函数为:
    F(x∣y)=P{X≤x∣Y=y}=∫−∞xf(u∣y)du,F(x|y)=P\{X\le x|Y=y\}=\int_{-\infty}^xf(u|y)du,F(x∣y)=P{X≤x∣Y=y}=∫−∞x​f(u∣y)du,
    而给定Y=yY=yY=y时,XXX的条件分布期望定义为:
    E[X∣Y=y]=∫xdF(x∣y)=∫xf(x∣y)dxE[X|Y=y]=\int xdF(x|y)=\int xf(x|y)dxE[X∣Y=y]=∫xdF(x∣y)=∫xf(x∣y)dx

注:

  1. X,YX,YX,Y都是随机变量,实则是从样本空间Ω\OmegaΩ到实数轴RRR上的映射。而x,yx,yx,y是什么呢?是映射的像值,是RRR上的一个定值。
  2. E(X∣Y)E(X|Y)E(X∣Y)对于每一个随机变量YYY的取值yyy有一个取值,因而我可以将E(X∣Y)E(X|Y)E(X∣Y)看做是有关随机变量Y 取值yyy的函数h(y)h(y)h(y)。
    (h(Y)h(Y)h(Y)和h(y)h(y)h(y)不太一样,h(Y)h(Y)h(Y)是由YYY和hhh复合而成的从样本空间FFF到RRR上的映射,而h(y)h(y)h(y)仅仅是从RRR到RRR上的映射。)
    h(Y):F⟶YR⟶E(X∣Y)RA⟶Yy⟶E(X∣Y)E(X∣Y=y)\begin{aligned} h(Y):&F\stackrel{Y}{\longrightarrow} R \stackrel{E(X|Y)}{\longrightarrow} R\\ &A\stackrel{Y}{\longrightarrow} y \stackrel{E(X|Y)}{\longrightarrow} E(X|Y=y) \end{aligned} h(Y):​F⟶Y​R⟶E(X∣Y)​RA⟶Y​y⟶E(X∣Y)​E(X∣Y=y)​
    h(y):R⟶E(X∣Y)Ry⟶E(X∣Y)E(X∣Y=y)\begin{aligned} h(y):&R \stackrel{E(X|Y)}{\longrightarrow} R\\ &y \stackrel{E(X|Y)}{\longrightarrow} E(X|Y=y) \end{aligned} h(y):​R⟶E(X∣Y)​Ry⟶E(X∣Y)​E(X∣Y=y)​
  3. 在X,YX,YX,Y为连续型随机变量时,对yyy要求fY(y)>0f_Y(y)>0fY​(y)>0,目的是为了使得条件概率密度函数f(x∣y)=f(x,y)fY(y)f(x|y)=\frac{f(x,y)}{f_Y(y)}f(x∣y)=fY​(y)f(x,y)​有意义。但是其实如果fY(y)=0f_Y(y)=0fY​(y)=0,我们也能够有计算的方法:
    但是这要用到测度论的内容,这个因为还没有学到严谨的定义,因而日后在开 这个

在上面注记2中,我们注意到h(Y)=E(X∣Y)h(Y)=E(X|Y)h(Y)=E(X∣Y)其实也是一个随机变量,在这里我们给这个特殊的随机变量一个名字,称之为X对Y的条件数学期望。(注意h(y)h(y)h(y)本身并不是一个随机变量)。

对于多元情形h(Y1,Y2,...,Yn)E(X∣Y1,Y2,...,Yn)h(Y_1,Y_2,...,Y_n)E(X|Y_1,Y_2,...,Y_n)h(Y1​,Y2​,...,Yn​)E(X∣Y1​,Y2​,...,Yn​)和刚刚的一元情形实际上是类似的,记
h(y1,y2,...,yn)=E(X∣Y1=y1,Y2=y2,...Yn=yn)h(y_1,y_2,...,y_n)=E(X|Y_1=y_1,Y_2=y_2,...Y_n=y_n)h(y1​,y2​,...,yn​)=E(X∣Y1​=y1​,Y2​=y2​,...Yn​=yn​)


随机变量关于子σ−\sigma-σ−代数的条件期望


Questions:

  1. 什么叫做A\mathscr{A}A-可测?
    实数上的任何博雷尔可测集在XXX下的原像属于A\mathscr{A}A,那么就称XXX是A\mathscr{A}A可测的。
  2. 什么叫做可积随机变量?
    RRR上任意BorelBorelBorel集在随机变量ξ\xiξ的映射原像为F\mathscr{F}F中σ−\sigma-σ−代数中的事件,那么称随机变量ξ\xiξ可测。
    通过该映射我们可以建立起对应于(Ω,F,P)的(\Omega,\mathscr{F},P)的(Ω,F,P)的(R,ξ)(R,\xi)(R,ξ)上的度量(R,B,P(⋅))(R,\mathscr{B},P(\cdot))(R,B,P(⋅)),
    我们之前考虑的概率分布函数F(x)=P(ξ≤x)F(x)=P(\xi\le x)F(x)=P(ξ≤x)其实就生成了(R,B)(R,\mathscr{B})(R,B)上的度量P(⋅)P(\cdot)P(⋅),有了度量空间(R,B,P(⋅))(R,\mathscr{B},P(\cdot))(R,B,P(⋅)),我们就能够在其上计算积分∑xP(x)=∫xdF(x)\sum xP(x)=\int x dF(x)∑xP(x)=∫xdF(x),所谓可积随机变量,其实是随机变量可积。也就是指其期望存在。
  3. E[ξ∣B]=E[η∣B]E[\xi|B]=E[\eta|B]E[ξ∣B]=E[η∣B]这个数学表述的具体含义用文字表述是什么?
  4. (Ω,F,P(⋅))⟶X(r.v.)(R,B,FX)⟶g(⋅):R→R(R,B,Fg(X))(\Omega,\mathscr{F},P(\cdot)) \stackrel{X(r.v.)}{\longrightarrow}(R,\mathscr{B},F_X )\stackrel{g(\cdot):R\rightarrow R}{\longrightarrow}(R,\mathscr{B},F_{g(X)})(Ω,F,P(⋅))⟶X(r.v.)​(R,B,FX​)⟶g(⋅):R→R​(R,B,Fg(X)​)
    在这个映射作用下,那些信息被保留了下来,作为整个传递过程的不变量?那些信息在传递过程中流失了?
    (在映射过程中,只要求像空间中σ−\sigma-σ−代数中元素的原像是原像空间中的σ−\sigma-σ−代数中元素,但是原像空间中的σ−\sigma-σ−代数中元素的像未必是像空间中σ−\sigma-σ−代数中元素。例子:可测函数中,原像中的可测集可能映射为像空间中的不可测集,比如常值函数。)

注:
1)ξ\xiξ关于A\mathscr{A}A的条件数学期望E[ξ∣A]E[\xi|\mathscr{A}]E[ξ∣A]是一个随机变量
2) A\mathscr{A}A是一个σ−\sigma-σ−代数,同时其本体也就是一个集族。

随机过程 Class 3 条件期望相关推荐

  1. 新书 | 经典教材应用随机过程出第12版啦!

    点击蓝字 关注我们 熟悉图灵专业数学书的同学们应该对谢尔登·M.罗斯(Sheldon M. Ross)不陌生,他是国际知名概率与统计学家,南加州大学工业与系统工程系的教授.罗斯教授著述颇丰,他的< ...

  2. 【数理知识】《随机过程》方兆本老师-第6章-鞅过程及其性质

    第5章 回到目录 无 第6章-鞅过程及其性质-<随机过程>方兆本 6.1 条件期望及其性质 定义6.1 条件期望 6.2 鞅过程 定义6.2 鞅序列 / 鞅差序列 6.3 鞅和鞅差的性质 ...

  3. 【数理知识】《随机过程》方兆本老师-第1章-引论

    无 回到目录 第2章 第1章-引论-<随机过程>方兆本 第1章-引论 1.1 引言 1.1.1 基本概念和例子 定义1.1 1.1.2 有限维分布和数字特征 1.1.3 平稳过程和独立增量 ...

  4. 【随机过程】随机过程之泊松过程的推广

    [随机过程]随机过程之泊松过程的推广 声明:引用请注明出处http://blog.csdn.net/lg1259156776/ 泊松过程的两个定义 def 1: 计数过程,增量独立,增量服从泊松分布: ...

  5. 随机过程(1.1)—— 概率空间、分布函数、Riemann-Stieltjes 积分

    概率论与随机过程课程笔记 文章目录 1. 概率空间与分布函数 1.1 概率空间 {Ω,F,P}\{\Omega,\mathscr{F},P\}{Ω,F,P} 1.1.1 样本空间 1.1.2 事件域 ...

  6. 随机过程 Markov 链(下)

    文章目录 随机过程 Markov 链(下) Markov 链的应用 群体消失模型(分支过程) 人口结构变化的 Markov 链模型 连续时间 Markov 链 定义与性质 Kolmogorov 微分方 ...

  7. 高等概率论和随机过程比较本质的介绍

    关于研究生阶段的概率论主干课程,说得简单一些,就是在测度论的基础之上,将本科学过的内容重新梳理,逐步加深.先前也提到过,在没学测度论的时候,很多基本的概率概念和定理的数学论证是没有办法严格给出的,相应 ...

  8. 【随机过程】12 - 泊松过程的推广型

    泊松过程的推广型 文章目录 泊松过程的推广型 1. 泊松过程基本型回顾 1.1 性质 1.2 泊松分布与射击模型 2. 泊松过程的推广型 2.1 放宽平稳性 2.1.1 非平稳泊松过程 2.2 放宽稀 ...

  9. 北京交通大学2022-2023学年第一学期研究生《随机过程I》试题

    北京交通大学2022-2023学年第一学期研究生<随机过程I>试题 北京交通大学随机过程I2022-2023第1学期期末考试试题 我有一个朋友是北交的研究生,他告诉我他们好多数学课都没有近 ...

  10. 【随机过程】 5 - 非平稳过程

    非平稳过程 文章目录 非平稳过程 1. 问题引入 2. 循环平稳过程 2.1 循环平稳过程的定义 2.2 循环平稳过程与宽平稳随机过程的关系 2.3 条件期望 2.3.1 定义 2.3.2 条件期望的 ...

最新文章

  1. Linux下root密码忘记的解决办法
  2. 乔布斯亲笔签名的Apple II手册 拍卖了511万元
  3. ASP.NET实现下载的中文文件名乱码处理
  4. 【转】【Linux】linux awk命令详解
  5. 【Nginx】实现负载均衡的几种方式
  6. 弱性能穿戴设备App化之Lua For STM32
  7. python服务端开发调试日志系统_Loglog首页、文档和下载 - 基于 Python2.7 的日志系统 - OSCHINA - 中文开源技术交流社区...
  8. 还在用老掉牙的后台模板?来试试这款人类高质量后台模板(Admin Plus)
  9. 程序员专属段子集锦 10/10
  10. 线程间共享 部分变量 Spring框架下向异步线程传递HttpServletRequest参数
  11. 抖音的广告位在哪?抖音信息流广告样式?
  12. 学习嵌入式Linux,做底层还是应用?底层要掌握哪些技能?
  13. 质安码区块链直推新零售通过线上线下资源整合,实现信息传递的最大化
  14. word,excel文件双击打开慢的问题
  15. saas商城跟源码商城对比优势在哪里
  16. 【编程初学者】创建自己的开源项目1-创建远程代码仓库
  17. 使用PYQT5打开电脑摄像头并进行拍照
  18. 校园二手物品商城交易平台
  19. P7395 弹珠游戏(2021 CoE-I C)
  20. 在vue里使用reset.css

热门文章

  1. 第三十八章 SQL命令 DROP TABLE
  2. 目标建立——SMART法则
  3. 计算机丢失OX0000007B,win10系统应用程序无法正常启动0x000007b的解决办法
  4. 战舰 Linux服务端,战舰帝国一键端手游服务端+GM工具+视频教程
  5. 恢复U盘分区:windows自带工具diskpart
  6. 软考:嵌入式系统设计师
  7. ffmpeg 裁剪视频 / 批量
  8. 现场总线课程设计——IIC总线
  9. QT软件开发: 基于QT设计的完整版视频播放器、多媒体播放器(mdk-sdk)
  10. cosh和acosh--双曲余弦和反双曲余弦函数