目录

一、多元正态分布的定义

1.定义

2.二元正态分布

二、多元正态分布的性质

【property1*】

【property2】

【property3】

【property4】

【property5】

【property6】

【property7】

【property8*】

【property9*】

【property10*】

【property11】

三、极大似然估计及估计量的性质

前言

1.极大似然估计

(1)极大似然估计介绍

(2)均值和协差阵的极大似然估计

(3)相关系数的极大似然估计

2.估计量的性质

(1)无偏性

(2)有效性

(3)一致性

(4)充分性

(5)MLE的不变性

四、复相关系数和偏相关系数

1.复相关系数

(1)前言

(2)定义

(3)复相关系数的MLE

2.偏相关系数

(1)前言

(2)引例

(3)定义

(4)一阶偏相关系数

(5)偏相关系数一般递推公式

(6)偏相关系数的MLE

(7)偏协方差矩阵的导出

五、均值和(n-1)S的抽样分布

1.均值的抽样分布

(1)正态总体

(2)非正态总体(多元中心极限定理)

2.(n-1)S的抽样分布

(1)矩阵的拉直

(2)威沙特分布的定义

(3)威沙特分布的性质

(4) (n-1)S的抽样分布


一、多元正态分布的定义

1.定义

一元正态分布的概率密度函数为:

若随机向量的概率密度函数为:

则称服从元正态分布,记作,其中,参数分别为的均值和协差阵。

2.二元正态分布

,这里。易见,的相关系数。当时,可得的概率密度函数为:

【注】二元正态分布等高线(见课本)

二、多元正态分布的性质

【property1*】

多元正态分布的特征函数为,其中

【property2】

是一个维随机向量,则服从多元正态分布,当且仅当它的任何线性函数维常数向量)均服从一元正态分布

【property3】

,其中常数矩阵,则

【注】该性质表明,(多元)正态变量的任何线性变换仍为(多元)正态变量

【eg】设维常数向量,则有上述性质2或3可知,

【eg】设其中,则:

【property4】

,则的任何子向量也服从(多元)正态分布,其均值为的相应子向量,协方差矩阵为的相应子矩阵

【注1】该性质表明多元正态分布的任何边缘分布仍为(多元)正态分布

【注2】随机向量的任何边缘分布皆为(多元)正态分布推不出该随机向量服从多元正态分布(反例:习题2.3)

【注3】正态变量的线性组合未必就是正态变量。

均为一元正态变量的联合分布为多元正态分布的一切线性组合是一元正态变量

【例】设,这里,则:

【property5】

相互独立,且,则对任意个常数,有

【注】此性质表明,独立的多元正态变量(维数相同)的任意线性组合仍为多元正态变量

【property6】

,对作如下的剖分:,其中矩阵,则子向量相互独立,当且仅当

【注】可作一般化推广,并对于多元正态变量而言,其子向量之间互不相关和相互独立是等价的

【eg3.2.5】设,其中,则不独立,独立

【property7】

,则

【property8*】

,其中,则相互独立,当且仅当

【property9*】

,其中,则相互独立,当且仅当

【property10*】

,将其作与性质(6)同样的剖分,则相互独立,也相互独立

【property11】

,对作如下的剖分:,其中矩阵,则给定的条件分布为,其中

【注1】分别成为条件数学期望,条件协方差矩阵。通常称为偏协方差矩阵

【注2】这一性质可作一般化推广,并对于多元正态变量,其子向量的条件分布仍是(多元)正态

【eg3.2.8】设,其中,试给定的条件分布。

根据【property11】得出

三、极大似然估计及估计量的性质

前言

  • 简单随机样本(简称样本):满足独立,且与总体分布相同。
  • 是从中抽取的一个样本
  • 数据矩阵或观测值矩阵:

1.极大似然估计

(1)极大似然估计介绍

  • 似然函数:是样本联合概率密度的任意正常数倍,记为,将其看作参数的函数,简记为
  • 极大似然估计:如果统计量满足,则称作的极大似然估计(MLE)
  • MLE思想:当样本给定后,可考虑对不同的,联合概率密度如何变,它反映了对样本的解释能力,这便是似然。MLE就是要寻找一个使得这个样本出现的概率最大

(2)均值和协差阵的极大似然估计

  • 一元正态情形:
  • 多元正态情形:,其中称为样本均值向量,称为样本离差矩阵或平方和及叉积和将矩阵,称为样本协方差矩阵

(3)相关系数的极大似然估计

其中。称为样本相关系数,为样本相关矩阵。

2.估计量的性质

(1)无偏性

  • 【定义】如果,则称估计量是被估参数的一个无偏估计,否则就成为有偏的
  • 【注1】
  • 【注2】的有偏估计
  • 【注3】

(2)有效性

  • 【定义】设的一个无偏估计,若对的任一无偏估计,有,即为非负定矩阵,则称一致最优无偏估计
  • 【注】可以证明,对于多元正态总体,分别是的一致最优无偏估计

(3)一致性

  • 【定义】如果未知参数(可以是一个向量或矩阵)的估计量随着样本量的不断增大,而无限地逼近于真值,则称一致估计(相合估计)
  • 【注1】估计量的一致性是在大样本情形下提出的一种要求,而对于小样本,他不能作为评价估计量好坏的准测
  • 【注2】可以证明,分别是的一致估计(无需总体正态性的假定)

(4)充分性

  • 【定义】如果一个统计量能把含在样本中的有关总体(或有关未知参数)的信息一点都不损失地充分提取出来,则这种统计量就称为充分统计量
  • 【注1】可以证明,对于总体,当已知时,的充分统计量;当已知时,充分统计量
  • 【注2】用来作为估计量的充分统计量称为充分估计量。这三者之间只相差一个常数倍,所含的信息完全相同,故当均未知时,也都是的充分统计量

(5)MLE的不变性

  • 【定义】如果的MLE,那么对于的函数,其MLE是
  • 【注】相关系数,因此其MLE为

四、复相关系数和偏相关系数

1.复相关系数

(1)前言

  • (简单)相关系数度量了一个随机变量与另一个随机变量之间线性关系的强弱
  • 复相关系数度量了一个随机基变量与一组随机变量之间线性关系的强弱

(2)定义

的相关矩阵。则的线性函数(任一维非零常数向量)间的最大相关系数称为 间的复(或多重)相关系数,记作,它度量了一个变量和一组变量间的相关程度。

的相关系数的平方

上述不等式由柯西不等式得到,若取,则上述等号成立。所以,的复相关系数为:

因而,

【注1】时,复相关系数退化为简单相关系数的绝对值

【注2】的负相关系数为0,当且仅当不相关(即

【注3】复相关系数通过求得,而其中的相关系数对变量单位的改变具有不变性,故复相关系数对变量单位的改变也具有不变性

【注4】若互不相关,即,于是有

即此时复相关系数的平方等于各分量相关系数的平方和

【eg3.4.1】试证随机变量的任一线性函数的复相关系数为1

(3)复相关系数的MLE

设样本的样本相关矩阵,这里则在多元正态的假定下,复相关系数的MLE为:

称为样本复相关系数。

2.偏相关系数

(1)前言

两个变量之间的相关性,除了受这两个变量彼此间的影响外,常常还受其他一系列变量的影响。由于这个原因,相关系数有时也称为总(或毛,gross)相关系数,其意思是包含了由一切影响带来的相关性。

相关系数有时亦称为简单相关系数或皮尔逊()相关系数或零阶偏相关系数

(2)引例

——家庭的饮食支出,——家庭的衣着支出,——家庭的收入

  • 之间存在着较强的正相关性
  • 分别与的强正相关性导致了的较强正相关性
  • 如果我们能用某种方式把的影响消除掉,或者说控制了(即保持不变),则之间(反应净关系)的相关性可能就很不一样了,很有可能会显示负相关性。
  • 【注】为了更好地理解本例,我们可设想某地区的这样两个样本:样本1由贫富悬殊的100户家庭组成,其之间一般会有非常强的正相关性;样本2由基本相同的100户家庭组成,  间的相关性一般会比较小或者为负。可以想象,在样本1和样本2中,消除了影响后的  之间的相关性一般会比较接近,且样本2中的  间的相关性往往不太受的影响

(3)定义

剖分如下:

为给定偏协方差矩阵。记,称偏协方差,它是剔除了的(线性)影响之后,之间的协方差。

给定的偏相关系数定义为

  • 【注1】度量了剔除的(线性)影响后,间相关关系的强弱
  • 【注2】对于多元正态变量,由于也是条件协方差矩阵,故此时偏相关系数与条件相关系数是同一个值,从而同时也度量了在给定的条件下间相关关系的强弱
  • 【注3】当不相关(即时),,从而

(4)一阶偏相关系数

可直接由相关系数算得,设是三个随机变量,则有:

【注1】并不意味着,反之亦然

【注2】未必同号,且大小无必然规律

(5)偏相关系数一般递推公式

(6)偏相关系数的MLE

在多元正态性的假设下,的MLE为:

其中,,称样本偏相关系数

(7)偏协方差矩阵的导出

五、均值和(n-1)S的抽样分布

1.均值的抽样分布

(1)正态总体

是从总体中抽取的一个样本,则

(2)非正态总体(多元中心极限定理)

是来自总体的一个样本,存在,则当很大且相对于也很大时,近似服从

2.(n-1)S的抽样分布

(1)矩阵的拉直

设随机矩阵,将的列向量一个接一个组成一个长向量,记作,即,称“vec”为拉直运算。当阶对称矩阵时,因,故只需取其下三角部分组成一个缩减了的常向量,记作,即

随机矩阵X的分布是指或(当时)的分布,拉直运算将矩阵分布问题转化为了向量分布问题。

(2)威沙特分布的定义

设随机向量独立同分布于,则阶矩阵的分布称为自由度为的(阶)威沙特分布,记作

时,显然有,即有

因此,威沙特分布是卡方分布在多元场合下的一种推广。

(3)威沙特分布的性质

  • 且相互独立,则
  • 常数矩阵,则

(4) (n-1)S的抽样分布

是取自的一个样本,,则可以证明相互独立,且有


【应用多元统计分析】CH3 多元正态分布相关推荐

  1. python 多元线性回归_多元统计分析之多元线性回归的R语言实现

    多元统计分析之多元线性回归的R语言实现 多元统计分析--multivariate statistical analysis 研究客观事物中多个变量之间相互依赖的统计规律性.或从数学上说, 如果个体的观 ...

  2. 【多元统计分析】一、多元统计分析概述

    〇.前情提要 b站看[厦门大学MOOC]多元统计分析,因为老师很好看. 参考: [厦门大学MOOC]多元统计分析 https://www.bilibili.com/video/BV1v7411E7PB ...

  3. 多元统计分析朱建平pdf_应用多元统计分析课后答案朱建平版[精心整理].doc

    应用多元统计分析课后答案朱建平版[精心整理] 第二章 2.1.试叙述多元联合分布和边际分布之间的关系. 解:多元联合分布讨论多个随机变量联合到一起的概率分布状况,的联合分布密度函数是一个p维的函数,而 ...

  4. 【多元统计分析】均值向量和协方差阵的检验——spss上机实验

    均值向量和协方差阵的检验--spss上机实验 #参考书目为<多元统计分析>(第五版)--何晓群.中国人民大学出版社 #如有错误,请指正!谢谢~ #关注公众号搜索同名文章获取数据~ 习题2. ...

  5. 多元统计分析及R语言建模(第五版)——第6章 判别分析课后习题

    第6章 判别分析 文章会用到的数据请在这个网址下下载多元统计分析及R语言建模(第五版)数据 练习题 1)考虑两个数据集x1 = [3 7 2 4 4 7],x2 = [6 9 5 7 4 8] (1) ...

  6. 多元统计分析最短距离法_(完整word版)多元统计分析模拟试题

    多元统计分析模拟试题(两套:每套含填空.判断各二十道) A卷 1)判别分析常用的判别方法有距离判别法.贝叶斯判别法.费歇判别法.逐步 判别法. 2)Q型聚类分析是对样品的分类,R型聚类分析是对变量_的 ...

  7. 多元统计分析基于r课后答案_何晓群版—多元统计分析课后练习答案.pdf

    何晓群版-多元统计分析课后练习答案 第1 章 多元正态分布 1.在数据处理时,为什么通常要进行标准化处理? 数据的标准化是将数据按比例缩放,使之落入一个小的特定区间.在某些比 较和评价的指标处理中经常 ...

  8. 多元统计分析何晓群_多元统计分析第四章作业

    关注公众号,更多资源分享 回复关键词:多元统计分析 即可获取更多详细其他章节答案 <多元统计分析>课后答案||何晓群版(第二章) <多元统计分析>第一章课后答案(何晓群编第五版 ...

  9. 多元统计分析最短距离法_多元统计分析重点

    多元统计分析重点宿舍版 第一讲:多元统计方法及应用:多元统计 方法分类(按变量.模型.因变量等) 多元统计分析应用 选择题:①数据或结构性简化运用的方法有:多元回归分析,聚类分析,主成分分 析, 因子 ...

  10. 多元统计分析matlab,MATLAB的统计工具箱中的多元统计分析中提供了聚类分析的两种方法...

    MATLAB的统计工具箱中的多元统计分析中提供了聚类分析的两种方法: 1.层次聚类hierarchical clustering 2.k-means聚类 这里用最简单的实例说明以下层次聚类原理和应用发 ...

最新文章

  1. 【DIY】一个名叫“故事鸡”的儿童玩具是如何用树莓派3B+练成的
  2. mysql dba系统学习(12)mysql的数据文件 mysql dba系统学习(13)mysql的体系结构
  3. matlab imwrite将图像保存到其他目录
  4. gcc编译器的整个工作过程
  5. 保姆级教程,终于搞懂脏读、幻读和不可重复读了!
  6. 算捡漏么?我发现了一个值2万美金的 Facebook DOM XSS 漏洞
  7. 高中计算机网络技术专业的自我鉴定,计算机网络技术专业的自我鉴定(精选5篇)...
  8. leetcode:骑士在棋盘上的概率
  9. 单选题计算机科学的奠基人是,超星尔雅计算机课程(2017年)
  10. Altium 怎么设置鼠标滚轮放大缩小
  11. 全面剖析canonical标签
  12. 磁盘配额(Quota)磁盘阵列(RAID)逻辑卷轴管理器(LVM)学习记录
  13. 课外知识:人工智能简明入门学习指南
  14. Allegro模块布局和布局复用
  15. iOS开发技术-实验一-简易计算器实现
  16. python多叉树遍历_基于Python的多叉树遍历算法
  17. div+css静态网页设计——迪斯尼公主滚动特效(7页) HTML5网页设计成品_学生DW静态网页设计代做_web课程设计网页制作
  18. 我们该如何设计数据库:“普通——文艺——二逼”的区别
  19. Linux下jar启停脚本
  20. Memory 基础知识介绍

热门文章

  1. EduCoder实践课程——Python零基础到精通 参考答案(六)
  2. 江西科技学院计算机二级考试,2014年上半年江西科技学院全国计算机二级考试报名通知...
  3. 欧拉公式,复数域的成人礼
  4. python 中 map函数的用法(超详细)
  5. EN 14313:PEF聚乙烯泡沫CE认证
  6. Gauss型求积公式
  7. 服务器插网线显示没插,求助贴 插网线连不上网
  8. 旧的机器装了XP以后频繁死机
  9. 棒球和垒球球棒的全球与中国市场2022-2028年:技术、参与者、趋势、市场规模及占有率研究报告
  10. 记录我的caffe2 vs2017安装过程