第四章、区间估计

4.1区间估计基本概念

4.1.1区间估计

参数估计分为点估计和区间估计,第三章中我们已经对众多点估计方法有了比较详细的介绍。而现在我们思考下,用点估计量来估计参数,估计正确的概率是多少呢?如果是连续型总体的话,估计量等于参数真值的概率是0!也就是说,点估计对于判断准确的把握是微乎其微的,所以我们需要提出区间估计。

点估计是用一个统计量来作为参数的估计,区间估计是找两个统计量

,其中对任何样本观测值都有
,并用区间
作为参数的

区间估计(量)。(注意,闭区间不是必要的,可以是开区间也可以是左开右闭等等)

是取自正态总体
的样本,那么
就是
的一个区间估计.在点估计部分,我们用样本均值作为
的点估计量,似乎这样是比较精确的(因为只用量来估计),但是样本均值刚好等于
的概率是为0的,而用区间
来估计,正确的概率是

也就是说,随机区间

涵盖参数真值的概率是0.9544(

注意不说

属于区间的概率)

,这是个比较高的概率!

4.1.2评价区间估计好坏

就像点估计部分提到的一样,根据区间估计的定义,我们可以选取任何满足

的两个统计量作为任何参数的区间估计。所以我们需要对给定的区间估计,给出一些评价的准则。我们在点估计部分提到了非常多的准则:无偏,有效,相合,渐进正态,均方误差等等。但区间估计的评价准则就只有两个:置信度和精确度。

※置信度准则

随机区间涵盖参数真值的概率称为置信度,即下面这个概率

(注意我们不说参数

属于区间的概率,因为这个概率中随机项是区间)

我们希望置信度越高越好。

然而这个概率一般来说是与

有关的,如果一个区间估计对于某些
置信度比较高,对于另外一些则比较低,那么我们也不认为这样的区间估计是好的。我们希望的是最小的置信度也比较高,这里的最小置信度也就是

置信系数,定义为

所以我们希望置信系数能够比较高。

样本

取自正态总体
,其中两个参数都未知,考察均值
的区间估计.

使用区间

作为均值
的区间估计,其中样本方差为
,也就是前面的
(为什么是这个形式之后会说),求一下它的置信系数。

对概率中事件的等价变形,根据之前的定理可以配凑出

分布形式

我们运气比较好,这个概率不依赖分布的参数,所以此时置信度也就是置信系数。在

的条件下,取不同的
,置信系数分别为

我们可以看到

是置信度最高的。

然而是不是置信度越高越好呢?当然不是,比如我们取整个实数轴作为区间估计,那么它涵盖参数真值的概率就是1,但是这样就没有任何意义了!所以我们还希望区间的长度不要太大,这也就是下面的精确度准则。

※精确度准则

关于这个准则有不同的标准,用的最多的就是随机区间

平均长度

,我们自然希望这个平均长度越小越好,这样用区间来估计参数就越精确。

求上面例子中区间估计的平均长度

上下限相减,关于样本均值那项消掉,剩下关于样本方差的。而正态总体的样本方差分布与卡方有关,于是通过配凑得到平均长度为

在样本容量固定的情况下,我们将两个例子比较一下:

  • k越大,平均长度越大,精确度越低
  • k越大,置信系数越高,置信度越高

可以发现,置信度与精确度实际上是相互制约的,如果我们追求高置信度,那么精确度就必然有损失,反之同理。但考虑到我们当时提出区间估计,就是要解决点估计的置信度低这么一个问题,所以统计学家Neyman提出:在保证置信度的前提下,追求高的精确度

4.1.3置信区间

根据名字,置信区间应该从属于置信度准则,下面是书上对它的定义,其中

可能会让人感到不习惯,这是因为第五章中显著性水平所使用的
与这里的
有一定的关系

定义 对给定的

,参数
的置信系数不低于
的区间估计
称为
的置信水平为
的置信区间,即

此时

分别称为参数
的置信水平为
的(双侧)置信下限和(双侧)置信上限。

这一区间估计实际上是一个统计量,当样本确定后,它就是一个完全确定的区间,也就是区间估计的一个实现。需要注意一点,不能把概率写成

因为小写代表的是区间估计的实现,它是一个具体的区间,而参数真值也是一个具体的值,其中没有任何随机的东西了,求概率就没有任何意义!

我们可以从两个角度来理解置信区间,对于一个置信系数为

的置信区间,

它的含义是什么呢

  • 你可以理解为我们抽取样本后,得到区间估计的一个实现,它至少有

    的机会包含参数真值.
  • 也可以理解为,我们抽取100组样本,得到区间估计的100个实现,其中应该有
    个区间包含参数真值.

对于上面这个图,中间的黑线就是那个实际存在但你我都不知道的参数真值,而黄线代表了我们抽取样本后得到的区间估计的实现,其中包含黑线的黄线数量,反映了区间估计的置信系数。

4.1.4同等置信区间

根据Neyman原则, 在保证置信度的前提下,我们要兼顾精确度。所以在给定置信水平为

的前提下,我们会取区间估计使得其涵盖真值的概率刚好等于
,这也就是同等置信区间,其定义与置信区间只相差一点:

定义 对给定的

,参数
的置信系数等于
的区间估计
称为
的置信水平为
的同等置信区间,即

4.1.5置信限

有时我们只关心参数不低于多少或不超过多少,比如研究电视机寿命时只会希望它不低于某个值,研究污染指数时只会希望它不高于某个值,这样我们就要用到置信限的概念。

将之前定义中的区间改为

,其中分别满足涵盖真值概率条件
,这时我们将
称为置信水平为

单侧置信区间(注意单侧不能省略,否则默认是双侧!),其中

分别称为

单侧置信下限单侧置信上限

类似地,我们将大于等于改成等于,就得到了同等单侧置信区间和同等单侧上下限.

下面这个引理给出单侧置信区间与双侧置信区间的关系,只是用来熟悉概念,之后并不会用它做任何事情:

引理

分别是参数的置信水平为
的单侧置信下、上限,那么
是参数的置信水平为
的双侧置信区间.

证明 完全按照定义,把单侧置信限翻译成概率条件

利用概率运算得

4.1.6置信域

置信域是针对多个代估参数的,这时参数空间是多维的,所以“区间”就变成了多维空间中的“区域”,二维时我们一般选取矩形区域,三维时取椭球、长方体区域等。

4.2枢轴(变)量法

枢轴量法是帮助我们寻找合适的区间估计的方法,主要分为三步

  • 构造枢轴量
  • 根据置信水平,得常数
    (如果是单侧则只有一个常数)
  • 等价改写概率得区间估计

什么是枢轴量?

枢轴量满足两个要求:

  • 形式上包含代估参数和样本,且不包含任何其他未知的参数
  • 分布完全已知

关于第一点的说明:

  1. 对于两个参数都未知的正态总体,如果求期望

    的区间估计,那么构造的枢轴量就必须含有
    ,且必须不含有
    !
  2. 因为枢轴量中包含了代估参数,实际上也是未知参数,所以它不是统计量!

如何构造枢轴量?

从代估参数的点估计量或是充分统计量出发,通过配凑让分布中不包含任何未知参数。

如何选取常数?

以求同等置信区间为例,我们已经构造了枢轴量

,那么根据置信水平我们需要选取常数满足

而满足上面这个概率等式的常数

有很多,因此一般还需遵循

两个原则

  • 选取的常数使得平均置信区间长度

    最小.
  • 如果使得平均置信区间长度最小的常数不易计算得出,就选取使得两头概率一样的常数,即

这样得出的区间也称为等尾置信区间.特别当枢轴量的分布是对称的时候,可以取常数

满足

啥叫等价改写概率?

将概率中不等式

通过等价变形改写为关于代估参数不等式,即

样本

取自均匀总体
,求参数
的置信水平为
的同等置信区间.

第一步,通过点估计量或充分统计量构造枢轴量。

参数

的一个充分统计量是
,将其除以
得到的
,其形式中有代估参数,且分布中不包含任何未知参数,所以
是合适的枢轴量.

第二步,找常数

由置信水平条件有

其中第一个等式利用密度函数

积分.

第三步,等价改写概率得区间估计

第二步中概率等价于

所以区间估计为

.

第二步中符合概率条件的常数有很多,所以我们想要选取一组使得平均区间长度最短,即

利用条件极值方法得到

,所以
的置信水平为
的最优同等置信区间.

最大值减最小值等于区间长度_数理统计第19讲(区间估计概念,枢轴量法)相关推荐

  1. 最大值减最小值等于区间长度_呆哥数学每日一题 ——三角函数求余弦最小值...

    如果想要获取往期每日一题电子版,可以加我微信:daigemath166,备注:知乎 每日一题 呆哥解析:今天我们来看一道三角函数求余弦最小值的题目 这里条件只有一个,那么我们第一步就是应该把两个角联系 ...

  2. 45.0.概率论与数理统计-区间估计,枢轴量法

    区间估计 问题引入 区间估计(confidence interval)定义 说明 构造置信区间的方法-枢轴量法 问题引入 枢轴量法,步骤 说明 问题引入 区间估计(confidence interva ...

  3. 最大值最小值计算机一级,excel怎么找最大值和最小值 excel怎么计算最大值减最小值...

    很多excel用户经常在表格中统计数据,很多时候我们需要找出其中的最大值和最小值,怎么找呢?我们可以一个一个的查找,如果数据多的话,就麻烦了,当然我们可以用公式去查找,优点是更快更准确,那么怎么找呢? ...

  4. c语言规定学号长度,c语言第1-9章基本概念练习题ans(最全).docx

    2010-2011 学年第二学期<C 语言程序设计>班名:学号:姓名:组号: 第一单元( 1-5 章)基本概念练习题 一.单选选择(直接在正确的选项上打勾,每题) 1.下面关于 C 语言特 ...

  5. 左神算法:最大值减去最小值小于或等于num的子数组的数量(Java版)

    本题来自左神<程序员面试代码指南>"最大值减去最小值小于或等于num的子数组的数量"题目. 题目 给定数组 arr 和整数 num,共返回有多少个子数组满足如下情况: ...

  6. c++求n的几次方_数理统计|笔记整理(E)——Ch7-C习题课

    上一节笔记传送门:数理统计|笔记整理(D)--Ch1-6习题课 -------------------------------------- 大家好!这一节我们依然会补充一些习题,内容则是正文的后半部 ...

  7. java加权区间调度_区间调度问题详解

    今天给大家介绍一下区间调度问题.区间调度是一类难度比较大,但同时应用比较广的问题,经常会在面试中以各种形式出现.本文将会介绍区间调度的各种变形,希望能使大家在面临区间调度问题时得心应手,并可以在实际工 ...

  8. Console-算法[]-数组求最大值和最小值(只能遍历一次)

    ylbtech-Arithmetic:Console-算法[]-数组求最大值和最小值(只能遍历一次) 1.A,Demo(案例) Console-算法[]-数组求最大值和最小值(只能遍历一次) 1.B, ...

  9. 向量图 正弦交流电路_第五节 正弦交流电路的相量(图)法求解.ppt

    第五节 正弦交流电路的相量(图)法求解 第五节 正弦交流电路的相量(图)法求解 一. 用相量图分析电路的主要依据 (1)在任一线性电路中,各同频率的正弦量可以 (2)R.L.C元件的电压和电流相量关系 ...

最新文章

  1. Are you missing a call to unregisterReceiver()?
  2. ubuntu g++编译32位应用
  3. 关于mysql的内部联结
  4. 数据泄漏保护:你的企业的投资是否足够?
  5. MySQL(7)数据库中的高级(进阶)语句:VIEW视图、联集和常见计算
  6. kafka学习(一)初识kafka
  7. 怎么在html中加入pjax,pjax加载多说的三种方法
  8. lua excel to mysql_在Lua程序中使用MySQL的教程
  9. 无法往开启kerberos的zookeeper上注册服务_笔记本WiFi信号满格,却无法上网怎么搞?...
  10. 第五章 常用页面元素自动化操作(上)
  11. Vue之安装Google开发插件
  12. 在做简单网页时,遇到的一些js问题
  13. linux 查看系统内存及系统负载
  14. cubieboard2 android,在cubieboard2双卡版上从零构建Android4.2.2系统
  15. 基于递归神经网络(RNN)的口语理解(SLU)
  16. mysql-8.0.21-winx64 安装
  17. python中print横向打印
  18. getch()、getche()、kbhit()的使用
  19. 对未来的打算和本专业的认识
  20. Git -- submoudule子模块使用

热门文章

  1. Flutter淘宝App之首页聚划算倒计时的实现
  2. Unity可视化编程Visual Scripting学习笔记5:2D围绕一点正转反转(输入事件)
  3. 关于创建的虚拟机mac 无法调整分辨率
  4. 2019天梯赛第四次训练赛
  5. 如何做一个基于微信菜谱美食小程序系统毕业设计毕设作品
  6. 移动App与服务器安全通信
  7. 请不要在Java项目中乱打印日志了,这才是正确姿势,非常实用!
  8. RollBack RX Professional 设置快照教程
  9. 浴血黑帮第三季/全集Peaky Blinders迅雷下载
  10. 深入浅出IAM(1)