【统计理论】关于置信度、置信区间的理解
太长不看(简要总结)
置信区间是估测总体参数的真值,这个值只有一个,且不会变动。例如做100次实验,100个成绩,95次实验的成绩区间包含总体均值,那么就代表置信度为95%。
随着置信度的上升,置信区间的跨度也就越大,对参数估计的精度必定降低。点估计就一个值,精度高,但置信度则低。(置信度与精度反方向变化)
这段是对参考资料的总结,下面基本摘自资源。
一、为什么要用区间估计?
首先,置信度这个概念的引入是为了配合一个叫做区间估计的东东。估算置信区间,通常都是用点估计算出来的数据加上一个变动幅度形成一个区间。在这个变动幅度里,涉及到一个参数就是置信度。
看个例子:你打枪打10次,你可以得到一个平均值,比如是8,那么我问你,总体的期望是不是就是8呢?你要说是,那就太草率了吧,因为你再打10次可能就是7了,那么总体的期望就变成7了嘛?当然不是,总体的期望是客观存在不会变的。实际上样本均值等于总体期望的概率是0啊,所以说,以点估点是不准确的。
但是既然样本是从总体中抽出来的,那么样本的均值和总体的期望应该差的不远吧?你射击的均值是8,总体的期望总不能是1吧?所以,你若换句话说打枪的平均环数是[6,8],那么相信的人就会很多了。可见,虽然扩大了总体期望的取值范围,但是可信度明显高了。当然也不能简单无限度扩大区间范围,比如说打枪的平均环数是[1,10],那肯定百分之百可信了,毕竟统计也要讲究一定的精度,所以就有了置信度。也就是说,你测得的均值,和总体真实情况的差距小于这个给定的值的概率,说你测得的均值就是总体期望是很草率的,但是说,我有95%的把握认为我测得的均值,非常接近总体的期望了,听起来就靠谱的多。
二、平时我们常说的95%置信度到底是什么意思呢?
要理解置信度,就要理解好置信区间。要理解置信区间,就要从统计学最基本最核心的思想去思考,那就是用样本估计总体。在统计学中,非常容易把概念模糊化,很容易把95%置信区间理解成为在这个区间内有95%的概率包含真值。
但是这里有两个容易混淆的地方
1、真值指得是样本参数还是总体参数?这个问题的答案是总体参数,我们取的数据是样本数据,点估计是样本参数的真实值,我们要估计总体参数。
2、95%的概率,变动的是谁?这里95%的概率,变动的是置信区间。
错误理解:假如有100个考生,100个学生中有95个考分落在(70,80)这个区间内。这就是95%置信度。这是非常错误的理解,样本与总体的关系没有思考清楚。置信区间是估测总体参数的真值,这个值只有一个,且不会变动。
那正确的应该怎么理解呢?样本数目不变的情况下,做一百次试验,有95个置信区间包含了总体真值。置信度为95%。换言之,若扩大样本容量,考100次试,这100名学生的成绩组成的区间有95次包含了总体真正的均值,那这才是95%置信度。说白了,我们有95%的把握说总体的真值在这个区间内。
三、是不是置信度越高越好?
这个问题就要看你需要统计的是什么?经济效益是什么?通常情况下,95%被作为常用的置信度,原理就在于3西格玛控制(在一些严格的领域甚至会用到6西格玛),此时已经有很高的置信度了,那在往上去,随着置信度的上升,置信区间的跨度也就越大,对参数估计的精度必定降低。点估计就一个值,精度高,但置信度则低,精度与置信度相互的取舍则要全由分析者自行选择了。
参考资料
- https://blog.csdn.net/yimingsilence/article/details/78084810
【统计理论】关于置信度、置信区间的理解相关推荐
- UA MATH566 统计理论8 用Pivot构造置信区间
UA MATH566 统计理论8 用Pivot构造置信区间 用Pivot构造置信区间 一般性方法 最优置信区间 置信区间的频率派解释 上一讲介绍的构造置信区间的方法是根据假设检验导出置信区间,但我们感 ...
- UA MATH567 高维统计 专题0 为什么需要高维统计理论?——理解稀疏向量与hard-threshold
UA MATH567 高维统计 专题0 为什么需要高维统计理论?--理解稀疏向量与hard-threshold 稀疏向量的soft-threshold与hard-threshold近似 引入hard- ...
- UA MATH566 统计理论 用点估计构造置信区间
UA MATH566 统计理论 用点估计构造置信区间 用点估计构造置信区间 置信区间(confidential interval,CI)也叫区间估计,是另一种做统计推断的方法,和假设检验密切相关.统计 ...
- UA MATH566 统计理论8 置信区间简介
UA MATH566 统计理论8 置信区间简介 例1:单个正态总体均值的置信区间(方差已知) 例2:单个正态总体均值的置信区间(方差未知) 假设检验与置信区间的关系 例3:根据单边检验导出单边置信区间 ...
- 数据分析面试题——统计理论
1. 扑克牌54张,平均分成2份,求这2份都有2张A的概率. 解: 排列公式 : A n m = n ( n − 1 ) ( n − 1 ) . . . ( n − m + 1 ) = n ! ( n ...
- UA MATH566 统计理论10 Bootstrap简介
UA MATH566 统计理论10 Bootstrap简介 Bootstrap是用来替代基于CDF的一些统计计算的手段:当真实的CDF(记为F∈FF \in \mathbb{F}F∈F,F\mathb ...
- 面向Python开发人员的综合置信区间全面理解
面向Python开发人员的综合置信区间全面理解 置信区间是以范围表示并汇总统计中的不确定性的.换句话说,这是一系列我们确信自己真正价值所在的价值观.例如:我有95%的信心认为人口平均数在8.76到15 ...
- UA MATH567 高维统计 专题0 为什么需要高维统计理论?——高维统计理论的常用假设
UA MATH567 高维统计 专题0 为什么需要高维统计理论?--高维统计理论的常用假设 延续前三讲对线性判别分析的讨论,在高维时,根据中心极限定理 n(Xˉ−μ)→dN(0,Id)\sqrt{n} ...
- UA MATH567 高维统计 专题0 为什么需要高维统计理论?——协方差估计的高维效应与Marcenko-Pastur规则
UA MATH567 高维统计 专题0 为什么需要高维统计理论?--协方差估计的高维效应与Marcenko-Pastur规则 上一讲我们介绍了在实验中,线性判别分析的判别误差会随着维度的上升而上升,而 ...
最新文章
- Linux下多线程同步方式之互斥量,信号量,条件变量
- Exported activity does not require permission
- 实验7-3-7 字符转换 (15分)
- java btrace_BTrace:Java开发人员工具箱中的隐藏宝石
- SpringSecurity 整合 JWT
- MySQL InnoDB Engine--数据预热
- 怎样在photoshop中快速批量,修改图片
- 清除dnf垃圾进程 .bat文件
- 【自编教材】16万8千字的HTML+CSS基础 适合从0到1-可收藏
- Java多人抽奖案例
- oeasy教您玩转python - 002 - # 你好世界 - 各位同学除夕快乐,除旧布新之时预祝能玩
- dechex() 函数
- Ubuntu 安装及基本配置(显示、镜像源、网络配置)
- matlab处理afm图片,基于MATLAB的增大页岩AFM灰度图分辨率的方法与流程
- 解决LDA生成的html文件打开为空。
- linux:ping不通www.baidu.com
- java fri星期转_如何在Java中将“Fri Sep 21 15:23:59 CEST 2012”转换为“2012-09-21T15:23:59”?...
- ubuntu系统中用c语言编写简单程序
- 【方法】STM32F103C8单片机通过定时器DMA测量脉冲宽度,无需CPU干预(以DHT11传感器为例)
- mysql中数据表null什么意思_MySQL 中NULL和空值的区别是什么?