由于平常学习自然语言处理的很多算法都来源于概率论和数理统计,因此找来陈老先生的著作温习巩固一下。具体内容请参考原著,本文仅作个人学习记录。

1.基本概念

主观概率:可以理解为一个人针对某一事件的一种心态或倾向性。这种倾向性一是根据其经验和知识所得,还有可能是根据其自身利害关系所得。主观概率虽然不具有坚实的客观理由基础,但是它却广泛存在于我们的生活当中,并可能反映认识主体的一种倾向性,因而具有其社会意义。
事件:概率论中的事件不是指已经发生了的情况,而是指某种(或某些)情况的‘陈述’,它可能发生,也可能不发生,发生与否,要到有关的‘试验’有了结果以后才能知道。事件特征有三(1)有一个明确界定的试验;(2)在试验前就明确了这个试验的全部可能结果;(3)当有一个明确的陈述界定了试验结果的全部可能结果中的一个确定的部分,其就叫做一个事件。由于事件是否在某次试验中的发生取决于机遇,因此在概率论中,事件常称为“随机事件”,其极端情况为“必然事件”和“不可能事件”。
古典概率定义:设一个试验有N个等可能结果,而事件E恰包含其中M个结果,则事件E的概率,记为P(E)=M/N。古典概率只能用于全部试验结果为有限个且等可能性成立的情况。如果引申为试验结果有无限多个的情况,就是“几何概率”,即等面积,等概率。
频率与概率:频率只是概率的估计而非概率本身,但当试验重复次数无限增大时,我们认为此时频率的极限就是概率。(大数定理)
排列与组合:排列有次序,而组合没有。
(1)排列公式:n个相异物体取r(1<=r<=n)个的不同排列总数
当n=r时,P=r(r-1)...1=r!,其中 0!=1
(2)组合公式:n个相异物件取r(1<=r<=n)个的不同组合总数。因为每一个包含r个物件的组合都可以产生r!个不同的排列,因此排列数应该是组合数的r!倍。
条件概率定义:设有两个事件A,B,且P(B)!=0,则“在给定B发生的条件下A的条件概率”,记为P(A|B)=P(AB)/P(B)
证明过程:设一个试验有N个等可能的结果,事件A、B分别包括其中M1和M2个结果,他们有M12个公共结果,即事件AB所包含的结果。若已经给定B发生,则可能的结果由N个缩减到M2个,其中只有M12个结果使事件A发生,则此时
P(A|B)=M12/M2=(M12/N)/(M2/N)=P(AB)/P(B)
事件的独立性:两个事件A、B,A的无条件概率P(A)与其给定条件B发生下的条件概率P(A|B)之间存在一些关联。若P(A|B)>P(A),则B发生使A发生的可能性增大了;若P(A|B)=P(A),则B发生与否对A发生的可能性毫无影响,此时就称A,B两事件独立。结合条件概率公式P(A|B)=P(AB)/P(B)可得,P(AB)=P(A)P(B)。
定理:若干个独立事件A1,...,An之积的概率等于各事件概率的乘积:P(A1...An)=P(A1)..P(An)
相加是互斥,相乘是独立!
全概率公式:设B1,B2...为有限或无限个事件,他们两两互斥且在每次试验中至少发生一个,即:
(1)BiBj=不可能事件(i!=j);
(2)B1+B2+...=Ω(必然事件)。
这样的一组事件称为“完备事件群”。
现考虑一个事件A,因为Ω为必然事件,有A=AΩ=AB1+AB2+...   。因B1,B2...两两互斥,显然AB1,AB2...也两两互斥,因此有P(A)=P(AB1)+P(AB2)+...
再由条件概率的定义,有 P(ABi)=P(Bi)P(A|Bi).带入上式得P(A)=P(B1)P(A|B1)+P(B2)P(A|B2)+...  这就是全概率公式,这个名字的意思就是全部概率P(A)被分成许多部分之和,应用的意义在当较复杂的情况下直接算P(A)不容易,但A总是伴随某个B出现,则可以构造这样一组Bi来简化计算。
贝叶斯公式:在全概率公式的假定公式之下,有
这就是神奇的贝叶斯公式。其神奇之处在于:如果我们把事件A看成结果,完备事件群B1,B2...看成导致这个结果可能的原因。则可以把全概率公式看成“由原因推结果”,而贝叶斯公式则是“由结果推原因”。
随机变量:就是其值随机会而定的变量。一种叫离散型随机变量,其特征只能取有限个值,或虽然在理论上能取无限个值,但这些值可以毫无遗漏地一个接一个排列出来。一种叫连续性随机变量,其全部可能取值不仅是无穷多个,并且还不能无遗漏地逐一排列,而是充满一个空间。

2.离散型随机变量的分布

概率函数:设X为离散型随机变量,其全部可能值为{a1,a2,...}则pi=P(X=ai) (i=1,2...)称为X的概率函数。
可以知道 pi>=0,p1+p2+...=1
上述公式指出了概率1在其可能值之间如何分布的,因此又称X的概率函数为随机变量X的概率分布。
分布函数:设X为一随机变量,则函数P(X<=x)=F(x)(-∞<x<+∞) 称为X的分布函数。对离散型随机变量而言,概率函数与分布函数是等价的,P(X<=x)=F(x)(-∞<x<+∞)=Σpi  可能概率值的累加
对随机变量X,其分布函数F(x)具有一下性质:
(1)F(x)是单调非降的,当x1<x2,有F(x1)<=F(x2)。这是因为当x1<x2时,事件{X<=x1}蕴含(被包含于)事件{X<=x2},因而前者的概率不能超过后者的概率;
(2)当x取极限正无穷时,F(x)趋近于1,当x取极限负无穷时,F(x)趋近于0。
二项分布:
满足两个条件:(1)各次试验的条件是稳定的,即事件A的概率p在各次试验中保持不变;
   (2)各次试验的独立性。
泊松分布:若随机变量X的可能取值为0,1,2,...,且概率分布为
则称X服从泊松分布,记为X~P(λ),λ>0是某一常数,等式右边对i=0,1,2..求和的结果为1。泊松分布多出现在当X表示在一定的时间或空间内出现的事件个数这种场合。
举例说明其产生的机制:若观测一定时间内某交通路口所发生的事故个数。设所观察的这段时间为[0,1),取一个很大的自然数n,把时间[0,1)分为等长的n段:L1=[0,1/n), L2=[1/n,2/n),....Li=[(i-1)/n,i/n),....Ln=[(n-1)/n,1),做几个假设:
(1)在每段Li内,恰发生一个事故的概率,近似的与这段时间的长1/n成正比,即可取为 λ/n,又假定在n很大因而1/n很小时,在Li这么短的一段时间内要发生两次或更多的事故是不可能的。因此,在Li时段内不发生事故的概率为1-(λ/n)
(2)L1、L2..Ln各段是否发生事故是独立的。
即把在[0,1)时段内发生的事故数X视为在n个小时段L1、L2..Ln内有事故的时段数,则此时X应服从二项分布B(n,λ/n)
但严格的讲,该公式知识近似成立,因为在假设(1)中,每个时段内发生一次事故的概率只是近似的为λ/n。当n取极限时,就得到确切的答案。当n取极限无穷大时,
第二个公式的取极限结果不太明白(好像为指数函数的公式)!!!
结合两式就得出上述的泊松分布,它是由二项分布的极限得到的。

3.连续型随机变量的分布

概率密度函数,简称密度函数:设连续型随机变量X有概率分布函数F(x),则F(x)的导数f(x) =F'(x)称为X的概率密度函数。反映了概率在x点处的密集程度。
连续型随机变量X的密度函数f(x)都具有以下三条基本性质:
(1)f(x)>=0;
(2)
(3)对任何常数a<b,有
下图为某一连续型随机变量X的分布函数F和概率密度函数f
正态分布:如果一个随机变量具有概率密度函数如下:
则称X为正态随机变量,并记为,N是“normal”正态一词的首字母,括号里为这个分布的参数。正态分布的图形如上图中的(b)
是正态分布N(0,1)的密度函数,N(0,1)称为标准正态分布。
指数分布:若随机变量X有概率密度函数,如下:
则称X服从指数分布,其中λ>0为参数。由于当x<=0时f(x)=0,表示随机变量取负值的概率为0,故X只取正值。下图中虚线表示当λ=1时指数分布图形,实线表示当λ=2时指数分布图形。指数分布最常见的应用场合就是寿命分布。
均匀分布:设随机变量X有密度函数,如下:
则称X服从区间[a,b]上的均匀分布,记为X~R(a,b)。
均匀分布的名称是因为密度函数f在区间[a,b]上为常数,因此在这个区间上,概率在各处的密集程度一样,或者说,概率均匀地分布在这个区间上。其密度函数f的图形和分布函数F的图形如下:
总结:密度函数是对每个可能值的模型表示,分布函数是随着变量的变化其值累积过程的模型表示。
B分布,又称beta分布也称贝塔分布,是指一组定义在区间的连续概率分布,有两个参数
其概率密度函数为:

其中是Gamma函数。随机变量X服从参数为的Β分布通常写作

4.离散型随机向量的分布

5.连续型随机向量的分布

6.边缘分布

设X=(X1,..,Xn)为一个n维随机向量,X有一定的分布F,这是一个n维分布。因为X的每个分量Xi都是一维随机变量,所以他们都有各自的分布Fi,这些都是一维分布。称为随机向量X或其分布F的边缘分布。

7.数学期望

事件X的期望值就等于X的可能值与其每个可能值的概率之积的累加。
定义:设随机变量X只取有限个可能值a1,...an,其概率分布为P(X=ai)=pi  (i=1,..,n)。则X的数学期望记为
E(X)=a1p1+a2p2+....+anpn
即随机变量取值的加权平均值。
性质:
(1)若干个随机变量之和的期望等于各变量的期望之和;假定个变量的期望都存在。
(2)若干个独立随机变量之积的期望等于各变量的期望之积;
(3)随机变量函数的期望。

8.大数定理

有时候一个有限的和很难求,但可以利用极限的方法来近似计算,并且一般情况下,和的极限分布就是正态分布。概率论上,习惯把和的分布收敛于正态分布的定理统称为“中心极限定理”。另一类重要的极限定理就是“大数定理”,它是由概率的统计定义“频率收敛于概率”引申出来的。“大数”的意思是指涉及大量数目的观察值Xi,它表明这种定理指出的现象只有在大量次数的试验和观察之下才能成立。

9.数理统计学

是指使用概率论和数学的方法,研究怎样收集(通过试验或观察)带有随机误差的数据,并在设定的模型(统计模型)之下,对这种数据进行分析(统计分析),以对所研究的问题做出推断(统计推断)。
由于近期有研究任务,不可能整本书细致读完,等有机会继续研读。
未完待续。。。

概率论与数理统计(陈希孺)学习笔记相关推荐

  1. 概率论与数理统计——高斯分布的学习笔记

    1 高斯分布的数学定义 高斯分布的定义来自<概率论与数理统计·浙江大学>:

  2. 《概率论与数理统计》再学习之事件的互斥(互不相容)和独立的关系

    前言 事件的互不相容性和独立性,在学习的时候突然觉得这两者之间总是存在是若即若离的关系,一时间不知道怎么去归纳总结好.一直找了很多信息来看,那么究竟应该怎么去区别或者什么时候使用比较好呢? 问题 互不 ...

  3. 郝志峰《概率论与数理统计》期末复习笔记

    目录 前言 第一章        概率论的基础概念 知识大纲 随机试验 随机事件 事件概率 等可能概率模型 第二章        概率论的基本定理 知识大纲 条件概率 独立性 全概率公式 贝叶斯公式 ...

  4. 【概率论与数理统计】猴博士 笔记 p11-14 一维、二维离散型求分布函数和期望、方差

    一维离散型求分布函数 通过一道例题来掌握这种题怎么做: 解: 一些补充: FX(x)表示的是P{X≤x}F_X(x)表示的是P \{X \le x\} FX​(x)表示的是P{X≤x} 如果只有X一个 ...

  5. 王式安概率论与数理统计基础课手写笔记-第一章概率与事件-第二章随机变量及其分布

    写在前面:做题还是要做的,但是课本上基础理论不能忘,比如每章前言,告知本章研究的内容及研究的方法.走过的路都算数. 文章目录 第一章 概率与事件 第二章 随机变量及其分布 第一章 概率与事件 第二章 ...

  6. 【概率论与数理统计】猴博士 笔记 p38-40 切比雪夫不等式、大数定律、中心极限定理

    文章目录 切比雪夫不等式 大数定律 中心极限定理 切比雪夫不等式 题干特征: 求的P里面有不等式 求的概率的事件是某个绝对值 求的P里面的不等式符号与外面的不等式符号相反 满足以上特征就要用到切比雪夫 ...

  7. 【概率论与数理统计】猴博士 笔记 p36-37 协方差、相关系数、不相关、相互独立时的期望和方差

    文章目录 协方差.相关系数 不相关.相互独立时的期望和方差 协方差.相关系数 接下来做几道例题,练习一下套公式: 例1: 解: 前4个就是简单的套公式: 第5个有点类似分配律: Cov(2X+3Y,4 ...

  8. 《概率论与数理统计》手写笔记

    文章目录(先整理这么多,后面的再批量处理) 1.1.3 事件之间的关系 1.2 事件的概率 1.2.1 概率的初等描述 1.2.2 古典概率(排列组合) 1.2.3 几何概型 1.1.3 事件之间的关 ...

  9. 【概率论与数理统计】猴博士 笔记 p26-28 F、f的性质、一、二维连续型求期望、方差

    F.f的性质 做法: 上述公式的原理: 做一些题目来练习套公式. 例1: 解: P{X≤2}=F(2)=1−e−2P\{X\le2\}=F(2)=1-e^{-2} P{X≤2}=F(2)=1−e−2 ...

  10. 【概率论与数理统计】猴博士 笔记 p29-32 均匀分布、泊松分布、指数分布、几何分布

    均匀分布U 题型:已知某随机变量满足某分布,求对应的概率,期望,方差. 也是套公式: 例1: 设随机变量X~U[2,5],求P{X>=4}.EX.DX. 套公式得: p{x≥4}=13EX=72 ...

最新文章

  1. callable object与新增的function相关 C++11中万能的可调用类型声明std::function...
  2. android复制图片,android图像保存到res / drawable文件夹[复制]
  3. AssetBundle Workflow
  4. python 语音播放_基于Python编写的语音播放软件
  5. 《TableStore最佳实践:GEO索引打造店铺搜索系统》
  6. Windows8 游戏开发教程-开篇
  7. csharp datagridview to a datatable,a dataset
  8. 总结51单片机避免复位触发的几种方法
  9. ftp匿名登录_flashfxp4,flashfxp4简介及好用的FTP工具
  10. springbootspringboot杏林中医诊所管理系统133742
  11. 马云:未来制造业要的不是石油 最大的能源是数据
  12. Windows使用批处理文件更改指定目录下的文件名(含序号)
  13. Codeforces 106 Buns【多重背包】
  14. 高级文本编辑器UltraEdit 18 Mac中文版
  15. 我写了一个套路,助你随心所欲运用二分搜索
  16. 入门系列之改进小波阈值降噪
  17. 为什么要进行系统拆分?
  18. LVM修复-误删除磁盘
  19. 如何美观的把SPSS统计结果复制粘贴到Word文档中?
  20. python实现猜数字游戏_python如何实现猜数字游戏

热门文章

  1. 数据结构与算法笔记——用Go语言描述
  2. 机器学习的所有资源链接和经验教训(八)深度学习框架
  3. 学习篇——微信小程序开发
  4. Spring源码下载并导入Idea
  5. 熠新科技亮相2019中国光纤传感学术会议暨产业化论坛
  6. SI9000阻抗计算安装教程
  7. java商城源码(servlet,springboot,html,vue,uniapp,小程序,android)一套任意组合
  8. 利用Procexp工具监控Windows平台上的Oracle数据库性能
  9. 部分格式文件解释以及万能文件查看器下载
  10. 类818tu.c微信小说分销系统设计之定时模板消息源码