数理统计——随机过程

文章目录

  • 数理统计——随机过程
    • 概述
    • 随机过程的定义
    • 随机过程的数字特征
    • 典型的随机过程
      • 独立增量过程
      • 泊松过程
      • 维纳过程
    • 马尔可夫过程
      • 定义
      • 平稳马尔可夫链
    • 小结

概述

这篇博文我们主要探讨在通信领域和自然语言处理(Natural Language Processing,NLP)等领域广泛出现的一个数理统计概念——随机过程(Stochastic Process)。随机过程,尤其是其中的马尔可夫过程,是NLP中应用非常广泛的经典模型——隐含马尔可夫模型(Hidden Markov Model,HMM)的理论基础。由于笔者的研究方向并不在通信领域,因此本文的方向会偏向于为机器学习服务。另外,这篇文章主要是为应用服务的,所以并不会过多地介绍一些数学上的名词、概念,而是注重理解模型。对细节感兴趣的读者可以参考高等教育出版社浙大第四版《概率论与数理统计》。

随机过程的定义

随机过程被认为是概率论的“动力学”部分,也就是说,它的研究对象是随时间(或者其他因素)演变的随机现象,需要用一系列甚至无穷多个随机变量来进行描述。比如下面的例子:

  1. 一个人每隔一段时间掷一次骰子,在ttt时刻掷出骰子的点数都可以用一个随机变量XtX_tXt​来描述。(这一随机过程也被称为伯努利过程伯努利随机序列
  2. 一个醉汉在一段时间内的位置坐标,在任意时刻ttt,他的坐标都可以用(Xt,YtX_t,Y_tXt​,Yt​)来描述。

诸如此类的,我们把这种依赖于“时间”ttt变化的一系列随机变量称为随机过程。对于随机过程,我们还能做进一步分类。在第1个例子中,在任意时刻ttt,都可以用一个随机变量进行描述,而且这个随机变量的取值是离散的,我们就称它为一维离散型随机过程;而第2个例子中,醉汉在任意时刻的坐标是用两个连续型随机变量进行刻画的,所以我们称它为二维连续型随机过程

此外,根据我们的参数ttt的取值是连续的还是离散的,还能把随机过程分为连续参数随机过程离散参数随机过程(也叫随机序列)。上面的例子中,掷骰子的时间是固定的、离散的,是离散参数随机过程,而醉汉的移动时间是连续的,是连续参数随机过程。

值得注意的是,在上面两个例子中,我们的参数ttt都表示时间。实际上,这个ttt可以是多种多样的,例如序号、距离等,在第一个例子中,如果我们给掷骰子的次数进行标号,构成一个参数集合TTT,那么它还是一个随机过程,只不过这次依赖的参数被定义为了次数,而不是时间。

随机过程的数字特征

在数学上,类似多元随机变量,随机过程也有其数字特征,它的数字特征一般是参数ttt的函数。

对于一维随机过程,设在时刻ttt对应的随机变量为X(t)X(t)X(t),有如下数字特征:

  • 均值函数μX(t)=E[X(t)]\mu_X(t)=E[X(t)]μX​(t)=E[X(t)]称为集平均统计平均
  • 均方值函数ΨX2(t)=E[X2(t)]\Psi_X^2(t)=E[X^2(t)]ΨX2​(t)=E[X2(t)]
  • 方差函数σX2(t)=E{[X(t)−μX(t)]}\sigma_X^2(t)=E\{[X(t)-\mu_X(t)]\}σX2​(t)=E{[X(t)−μX​(t)]}它的算术平方根称为标准差函数
  • 自相关函数RX(t1,t2)=E[X(t1)X(t2)]R_X(t_1,t_2)=E[X(t_1)X(t_2)]RX​(t1​,t2​)=E[X(t1​)X(t2​)]
  • 自协方差函数CX(t1,t2)=E{[X(t1)−μX(t1)][X(t2)−μX(t2)]}C_X(t_1,t_2)=E\{[X(t_1)-\mu_X(t_1)][X(t_2)-\mu_X(t_2)]\}CX​(t1​,t2​)=E{[X(t1​)−μX​(t1​)][X(t2​)−μX​(t2​)]}简称协方差函数

对于二维随机过程(X(t),Y(t))(X(t),Y(t))(X(t),Y(t)),有如下数字特征:

  • 互相关函数RXY(t1,t2)=E[X(t1)Y(t2)]R_{XY}(t_1,t_2)=E[X(t_1)Y(t_2)]RXY​(t1​,t2​)=E[X(t1​)Y(t2​)]
  • 互协方差函数CXY(t1,t2)=E{[X(t1)−μX(t1)][Y(t2)−μY(t2)]}C_{XY}(t_1,t_2)=E\{[X(t_1)-\mu_X(t_1)][Y(t_2)-\mu_Y(t_2)]\}CXY​(t1​,t2​)=E{[X(t1​)−μX​(t1​)][Y(t2​)−μY​(t2​)]}

对随机变量的数字特征我只是简单罗列,并不加以阐释,有兴趣的读者可以参考我概述部分提到的资料。

典型的随机过程

独立增量过程

独立增量过程是一个非常重要的随机过程,它在数学上的定义如下:

对任意选定的正整数n和任意选定的0<t1t_1t1​<t2t_2t2​<···<tnt_ntn​,如果对应的n个增量X(t1)−X(0)X(t_1)-X(0)X(t1​)−X(0),···,X(tn)−X(tn−1)X(t_n)-X(t_{n-1})X(tn​)−X(tn−1​)相互独立,则称这个随机过程为独立增量过程。

简单地来说,就是随机过程在不重合的区间上的增量是相互独立的,它就是独立增量过程。

另外还有一个概念,如果增量的概率分布只与时间差有关,与具体处于什么时间无关,那么就称增量具有平稳性,相应的独立增量过程是齐次的时齐的

泊松过程

首先是计数过程的概念,考虑这样一个例子:假设有很多很多蚂蚁要回家,我们用随机变量N(t)N(t)N(t)来表示从0时刻到ttt时刻回到家的蚂蚁数。对于这样一个随机过程,它的时间是连续的,随机变量的取值只能取非负整数,这样的过程,我们称为计数过程

由此引出泊松过程(泊松流)的定义,若一个随机过程满足:

  1. 它是计数过程;
  2. 它是独立增量过程;
  3. 对任意的t>t0≥0t>t_0\geq0t>t0​≥0,增量N(t)−N(t0)∼π(λ(t−t0))N(t)-N(t_0)\sim\pi(\lambda(t-t_0))N(t)−N(t0​)∼π(λ(t−t0​));
  4. N(0)=0N(0)=0N(0)=0,

那么我们称{N(t),t≥0N(t),t\geq0N(t),t≥0}是强度为λ\lambdaλ的泊松过程

从定义中不难看出,之所以称为泊松过程,是因为它的增量服从泊松分布。当然,这里的强度λ\lambdaλ可以是非均匀的,这里的λ\lambdaλ可以是ttt的函数。

关于泊松分布有如下定理:

  • 强度为λ\lambdaλ的泊松过程的点间间距(点间间距是相邻两个事件出现的时间差)是独立同分布的随机变量,都服从参数为1λ\frac{1}{\lambda}λ1​的指数分布。

该定理的逆定理也成立。

泊松过程是研究排队理论的工具,在技术领域内又是模拟一类重要噪声的基础。

维纳过程

维纳过程是布朗运动的数学模型,也是一种独立增量过程。设关于ttt的随机变量为W(t)W(t)W(t),定义如下:

  1. 独立增量过程;
  2. 对任意的t>s≥0t>s\geq0t>s≥0,增量W(t)−W(s)∼N(0,σ2(t−s))W(t)-W(s)\sim N(0,\sigma^2(t-s))W(t)−W(s)∼N(0,σ2(t−s))
  3. W(0)=0W(0)=0W(0)=0,

则称此过程为维纳过程。

马尔可夫过程

定义

在实际生活中,我们往往会遇到这样的情况:一件事情,在下一时刻发生的情况仅与现在的情况有关,而与之前发生的情况无关。换句话说,就是“未来”只与“现在”有关,而与“过去”无关。比如下面几个例子:

  • 象棋棋盘上的棋子,在下一回合的位置只与它现在所处的位置有关。
  • 商店前的一条队伍,它在下一时刻的长度只与它现在的长度有关。

我们把这种性质称为马尔可夫性无后效性。具有马尔可夫性的随机过程就是马尔可夫过程。数学上是采用条件概率的方式来定义的:

对于随机过程X(t)X(t)X(t),如果对参数ttt的任意nnn个取值t1<t2<⋅⋅⋅<tn,n≥3t_1<t_2<···<t_n,n\geq3t1​<t2​<⋅⋅⋅<tn​,n≥3,若P{X(tn)∣X(t1),X(t2),⋅⋅⋅,X(tn−1)}=P{X(tn)∣X(tn−1)}P\{X(t_n)|X(t_1),X(t_2),···,X(t_{n-1})\}=P\{X(t_n)|X(t_{n-1})\}P{X(tn​)∣X(t1​),X(t2​),⋅⋅⋅,X(tn−1​)}=P{X(tn​)∣X(tn−1​)}则称该过程为马尔可夫过程。

考虑我们之前谈论到的两个典型过程可以发现,泊松过程实际上就是时间连续状态离散的马尔可夫过程,维纳过程是时间和状态都连续的马尔可夫过程,时间和状态都是离散的马尔可夫过程称为马尔可夫链。如果马尔可夫链从一个状态到另一个状态的概率只与时间差有关,那么我们称马尔可夫链是平稳的,下面我们来讨论平稳马尔可夫链。

平稳马尔可夫链

我们已经知道马尔可夫链是时间和状态都离散的马尔可夫过程,因此,我们假设一个马尔可夫链X(t)X(t)X(t)共有kkk个状态,记作a1,a2,⋅⋅⋅,aka_1,a_2,···,a_ka1​,a2​,⋅⋅⋅,ak​,我们把马尔可夫链的状态发生一次变化称作一次转移,我们可以用矩阵来表示马尔可夫链的一步转移概率:
P=[p11p12⋅⋅⋅p1kp21p22⋅⋅⋅p2k⋅⋅⋅pij⋅⋅⋅pikpk1pk2⋅⋅⋅pkk]P= \left[ \begin{matrix} p_{11} & p_{12} & ··· & p_{1k}\\ p_{21} & p_{22} & ··· &p_{2k} \\ ··· & p_{ij} & ··· &p_{ik}\\ p_{k1}&p_{k2}&···&p_{kk} \end{matrix} \right] P=⎣⎢⎢⎡​p11​p21​⋅⋅⋅pk1​​p12​p22​pij​pk2​​⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅​p1k​p2k​pik​pkk​​⎦⎥⎥⎤​其中,pijp_{ij}pij​表示一次转移中,马尔可夫链从状态aia_iai​转移到aja_jaj​的概率。上面的矩阵被称为一步转移概率矩阵。由概率论的基本知识可以知道:∑j=1kpij=1\sum_{j=1}^kp_{ij}=1j=1∑k​pij​=1也就是说一步转移概率矩阵每行元素的和等于1。根据一步转移概率矩阵,我们可以通过矩阵乘法得出n步转移概率矩阵:Pn=PnP_n=P^nPn​=Pn其中PnP_nPn​中第iii行第jjj列的元素pij′p'_{ij}pij′​表示的含义为:通过nnn次转移,马尔可夫链的状态从aia_iai​变为aja_jaj​的概率。

从上可以看到,一步转移概率矩阵对于刻画平稳马尔可夫链非常的重要,实际上,对于使用马尔可夫链的数学模型或是机器学习模型,其最重要的一点就是估算或者确定马尔可夫链的一步转移概率矩阵

小结

本文主要是在数学上叙述了随机过程的概念,以及介绍了在机器学习中应用甚广的马尔可夫链。更多的内容,我会在介绍HMM时涉及。

数理统计——随机过程相关推荐

  1. 在Uubuntu 14.04 64bit上搭建NumPy函数库环境

    为了研究<机器学习实战>这本书, 我需要使用Python来编写代码, 特别需要使用NumPy这个函数库.为此,按照书上的说明, 验证如下. 直接在Linux终端输入python进入其命令行 ...

  2. 人工智能技术进阶路线

    人工智能初阶 数学基础 微积分 线性代数 朴素概率论 朴素统计学理论 朴素优化理论 编程基础 Python基础语法 Pandas基础操作 SQL基本操作 Spark基本操作 PyTorch基本操作 T ...

  3. 计算机都学什么数学,计算机专业的数学应学到什么水平?应该学习数学的那些分支?...

    本人是数学系的, 但其实真正的爱好是计算机. 当年报志愿的时候不知听谁说了句, 学计算机, 想搞软件就去学数学, 想搞硬件就去学物理, 然后就报了数学. 在数学系, 感觉思维确实受到了训练, 但所学的 ...

  4. 南开大学数学院本科生课程信息汇总表(2013.11.19)

          数学院本科生课程信息汇总表         课程代码 课程名称 英文课程名称 课程组成员 学分 先导课程 参考教材 作者 出版社 1010011090 概率论 江一鸣 4 数学分析 概率论 ...

  5. 机器学习应该准备哪些数学预备知识?

    转 https://www.zhihu.com/question/36324957 https://www.zhihu.com/question/36324957/answer/139408269 机 ...

  6. 计算机专业的数学应学到什么水平?应该学习数学的那些分支?

    本人是数学系的, 但其实真正的爱好是计算机. 当年报志愿的时候不知听谁说了句, 学计算机, 想搞软件就去学数学, 想搞硬件就去学物理, 然后就报了数学. 在数学系, 感觉思维确实受到了训练, 但所学的 ...

  7. 高等数学·同济七版+线性代数第六版+概率论与数理统计第四版(教材+辅导)

    教材加辅导 内容简介 <高等数学>第7版是普通高等教育"十二五"国家级规划教材,在第6版的基础上作了进一步的修订.版教材在保留原教材结构严谨,逻辑清晰.叙述详细.通俗易 ...

  8. 新书 | 经典教材应用随机过程出第12版啦!

    点击蓝字 关注我们 熟悉图灵专业数学书的同学们应该对谢尔登·M.罗斯(Sheldon M. Ross)不陌生,他是国际知名概率与统计学家,南加州大学工业与系统工程系的教授.罗斯教授著述颇丰,他的< ...

  9. 搞学术离不开的那些数学—概率论与数理统计

    概率论与数理统计 声明:本博客仅作为学习.复习所用,该博客参考的教材为高等教育出版社出版的 浙江大学 第四版<概率论与数理统计>教材,并参考了四川大学 徐小湛老师的讲课视屏(再次声明本博客 ...

  10. 概率论与数理统计思维导图_数学思维到底有多重要?这个学科往往影响国家实力...

    原标题:<关于加强数学科学研究工作方案>日前发布--数学思维今何在 密码学家王晓云日前获得了2019年未来科学大奖数学与计算机科学奖.她提出密码哈希函数的碰撞攻击理论,推动帮助新一代密码哈 ...

最新文章

  1. 解释性的语言vs编译性语言
  2. 并发编程线程通信之管道流
  3. 第三次学JAVA再学不好就吃翔(part41)--修饰符
  4. 为什么苹果有2500亿美刀不用,偏偏要借钱?
  5. NSValue包装自定义结构体
  6. ppt图表图表类型起始_梅科图表
  7. 洞察SaaS:中国SaaS的前世今生
  8. Oracle 11g Dataguard搭建及知识梳理
  9. 国外程序员薪资曝光,美国最高,均年薪95879美元
  10. 网易游戏开发工程师笔试题
  11. SEO必备工具之Xenu(绿蜗牛)网站死链接检测
  12. ARP防火墙单机个人版 “此版本已过期,请下载最新版”
  13. 实验室管理系统LIMS的作用和意义
  14. display几种常用的属性值
  15. 完全卸载软件及电脑软件残留
  16. C/C++中#和##的宏以及进行“花里胡哨“的命名及其应用
  17. 简单易学:本身就很小且简单
  18. vscode ssh: Resolver error: Error: XHR failedscode错误
  19. XILINX FPGA OV5640 摄像头驱动(一)
  20. R048---UiPath中四种筛选数据的方法

热门文章

  1. qq微信淘宝京东自动转链转发机器人MkStone京东淘宝转链助手
  2. oracle 谭岚_谭岚Oracle视频教程
  3. PreferenceActivity(首选项设置页)
  4. 晶闸管调压电路的matlab仿真,基于SIMULINK晶闸管调压电路仿真及分析.doc
  5. 加密与解密工具大礼包 2010年新品
  6. gateway权限统一认证
  7. java毕业设计明德学院网站源码+lw文档+mybatis+系统+mysql数据库+调试
  8. 《史蒂夫·乔布斯传》PDF下载
  9. vue项目中使用 ttf字体
  10. 中国平面设计指导价格